Saltear al contenido principal
Translator
Esta página ha sido traducida automáticamente por el servicio de traducción automática de Microsoft Translator. Aprende más

Microsoft Translator blog

Microsoft Translator publica públicamente el corpus de traducción de discursos

christian_federmann
Christian Federmann, Gerente Senior de programas

Como parte de un esfuerzo continuo dentro de Microsoft para mejorar la exactitud de los sistemas de inteligencia artificial (IA), Microsoft Translator publica públicamente un conjunto de datos que incluye múltiples conversaciones entre hablantes bilingües que hablan francés, Alemán e inglés.

Este corpus, que fue producido por Microsoft utilizando hablantes bilingües, tiene como objetivo crear un estándar mediante el cual las personas puedan medir cuán bien funcionan sus sistemas conversacionales de traducción de discursos. Puede servir como un conjunto de datos estandarizados para probar sistemas bilingües de traducción del habla Función en vivo de Microsoft Translator Y Traductor de Skype.

Christian Federmann, un administrador de programas Senior que trabaja con el equipo de Microsoft Translator, dijo que no hay tantos conjuntos de datos estandarizados para probar los sistemas bilingües de traducción de discursos conversacionales. "Necesita datos de alta calidad para poder realizar pruebas de alta calidad", dijo Federmann.

El equipo de Microsoft espera que el corpus, que está disponible libremente, beneficie a todo el campo de la traducción conversacional y ayude a crear benchmarks más estandarizados que los investigadores pueden utilizar para medir su trabajo contra otros.

"Esto ayuda a impulsar el campo hacia adelante", dijo Will Lewis, un director de programa técnico principal con el equipo de Microsoft Translator que también trabajó en el proyecto.

Descargar el corpus de traducción de lenguaje de voz de Microsoft aquí.

Obtenga más información sobre esta versión, así como otras formas en las que Microsoft está trabajando para hacer que IA sea más inteligente y precisa en el Microsoft Research blog.

 

Aprende más