Avances en la traducción del discurso de nuestros equipos de investigación
Este es el año del aprendizaje automático y los macrodatos. Si se está prediciendo resultados políticosSobrealimentación sus hojas de cálculo de ExcelAyudando asignar consultas a la intención en la búsqueda, o incluso personalizar un motor de traducción para ajustarse mejor a su contenido, estas áreas de investigación juegan un papel protagonista en la transformación de la tecnología y la productividad.
Un par de semanas atrás, en el decimocuarto año La computación en la Conferencia del siglo XXI, los asistentes vieron un vistazo de donde más estas tecnologías nos están llevando – y nos encantó. Rick Rashid, que dirige Microsoft Research en todo el mundo, subió al escenario y en el lapso de ocho oraciones, consiguió el 2000 + fuerte multitud en sus pies y animar. Fue un momento en el que la tecnología era indistinguible de la magia – y uno que estimularía a los escritores de ciencia ficción a empezar a pensar en mayores desafíos para los investigadores para hacer frente a 🙂
Vea el video para ver por usted mismo:
Se empleó una combinación de poderosas tecnologías para hacer posible esta sorprendente demostración: el procesamiento basado en la red neuronal profunda combinada con computación de alto rendimiento permitió un salto significativo en la exactitud del reconocimiento de voz. el Tecnología Microsoft Translator que usas cada día fue Personalizado para ajustarse mejor al contenido del discurso de Rick. Nueva tecnología de síntesis de voz que permite la personalización de las características acústicas fue capaz de crear "voz de Rick" en un idioma que no habla. Usted puede leer Rick blog post aquí.
Algunas de estas tecnologías ya están disponibles hoy en día, especialmente la traducción líder en la industria (Microsoft Translator) con capacidades de personalización (Hub de traductores). Si usted es un usuario de Windows Phone, usted ha estado disfrutando de la aplicación de traducción más innovadora en cualquier teléfono desde hace más de un año, que incluye una experiencia de traducción de voz temprana que se ha afinado para las situaciones de viaje. La salida de audio que escuchas en Bing Translator sitio web utiliza algunos de los nuevos motores de síntesis de voz que salen de nuestra investigación del habla. La investigación de Deep-neural-net también está detrás de nuestro servicio de indexación de audio/vídeo: MAVIS, que está disponible comercialmente.
La emoción que se ha Ondulación A través de la Web en respuesta a esta demostración es un indicador de cuánto todo el mundo quiere experimentar esta ' magia '. Hay mucho trabajo que hacer, pero usted verá los beneficios de esta investigación increíble en nuestros productos en nuestros futuros lanzamientos.
Vikram dendi
Director
Microsoft/Bing Translator y Microsoft Research