Microsoft Translator publica públicamente el corpus de traducción de discursos
Christian Federmann, Gerente Senior de programas |
Como parte de un esfuerzo continuo dentro de Microsoft para mejorar la exactitud de los sistemas de inteligencia artificial (IA), Microsoft Translator publica públicamente un conjunto de datos que incluye múltiples conversaciones entre hablantes bilingües que hablan francés, Alemán e inglés.
Este corpus, que fue producido por Microsoft utilizando hablantes bilingües, tiene como objetivo crear un estándar mediante el cual las personas puedan medir cuán bien funcionan sus sistemas conversacionales de traducción de discursos. Puede servir como un conjunto de datos estandarizados para probar sistemas bilingües de traducción del habla Función en vivo de Microsoft Translator Y Traductor de Skype.
Christian Federmann, un administrador de programas Senior que trabaja con el equipo de Microsoft Translator, dijo que no hay tantos conjuntos de datos estandarizados para probar los sistemas bilingües de traducción de discursos conversacionales. "Necesita datos de alta calidad para poder realizar pruebas de alta calidad", dijo Federmann.
El equipo de Microsoft espera que el corpus, que está disponible libremente, beneficie a todo el campo de la traducción conversacional y ayude a crear benchmarks más estandarizados que los investigadores pueden utilizar para medir su trabajo contra otros.
"Esto ayuda a impulsar el campo hacia adelante", dijo Will Lewis, un director de programa técnico principal con el equipo de Microsoft Translator que también trabajó en el proyecto.
Descargar el corpus de traducción de lenguaje de voz de Microsoft aquí.
Obtenga más información sobre esta versión, así como otras formas en las que Microsoft está trabajando para hacer que IA sea más inteligente y precisa en el Microsoft Research blog.
Aprende más
- Documento de investigación: traducción de lenguaje de voz de Microsoft (MSLT) corpus: la versión 2016 de IWSLT para inglés, francés y alemán
- Cómo funciona la traducción automática
- Pruebe la traducción de voz en la característica en directo de Microsoft Translator
- API de traducción de voz de Microsoft Translator