Grupo de traducción automática en Microsoft Research
El grupo de traducción automática de Microsoft Research (MSR-MT) ha sido uno de los principales organismos de investigación en el espacio de traducción automática durante más de 8 años, y algunos de los trabajos fundacionales en el procesamiento del lenguaje natural en MSR comenzaron hace más de 16 años. El enfoque del equipo de traducción automática integra características lingüísticas con algoritmos de traducción automática estadística de vanguardia. El enfoque del equipo siempre ha sido la adquisición automática de conocimientos de traducción de Corpora bilingüe, es decir, datos paralelos que consisten en oraciones originales del idioma de origen y sus traducciones correspondientes por traductores humanos. Hace aproximadamente 3 años, el enfoque del equipo cambió de un enfoque puramente basado en reglas a esta tarea hacia un enfoque híbrido que incluye un extenso procesamiento estadístico, lo que permite una mayor escalabilidad entre dominios y en nuevos idiomas.
La tecnología de traducción automática de Microsoft se desarrolló por primera vez para fines de localización interna, para conceder nuestra organización de soporte al cliente para publicar documentos de soporte técnico con una amplitud de frecuencia y lenguaje que habría sido prohibitivamente costoso utilizando traductores humanos. Con todos los documentos traducidos previamente por Microsoft y el software localizado a su disposición, el equipo de MT pudo entrenar automáticamente su motor MT estadístico para lograr una calidad bastante buena en el ámbito técnico. Esta tecnología se amplió para admitir el equipo de localización de Windows, la división de desarrolladores, MSDN y varios otros grupos dentro de Microsoft. También ha permitido a Microsoft llegar a muchos más clientes de lo que nunca hubiera sido posible utilizando la traducción humana sola.
Después de centrarse en las necesidades de traducción propias de Microsoft, el equipo comenzó a construir un servicio Web escalable que le permitiría proporcionar servicios de traducción al público en general, como un herramienta autónoma en la web, y como una característica dentro de otros productos. Dado que el motor de Microsoft MT ha sido entrenado más fuertemente en datos técnicos, todavía no se ha afinado para traducir texto en otros dominios de tema. Sin embargo, esperamos seguir mejorando la calidad y amplitud del motor. Esperamos compartir nuestros desarrollos con usted durante los próximos meses en este blog.
– Heather