Microsoft Translator rilascia pubblicamente il corpus di traduzione vocale
Christian Federmann, Senior Program Manager |
Come parte di uno sforzo continuo all'interno di Microsoft per migliorare la precisione dei sistemi di intelligenza artificiale (AI), Microsoft Translator sta rilasciando pubblicamente un set di dati che include più conversazioni tra gli oratori bilingue che parlano francese, Tedesco e inglese.
Questo corpus, che è stato prodotto da Microsoft utilizzando altoparlanti bilingui, mira a creare uno standard con cui le persone possono misurare quanto bene i loro sistemi di traduzione vocale conversazionale funzionano. Può fungere da set di dati standardizzati per testare sistemi di traduzione vocale bilingue, come la Funzionalità Microsoft Translator Live e Traduttore Skype.
Christian Federmann, un Senior Program Manager che lavora con il team Microsoft Translator, ha detto che non ci sono tanti set di dati standardizzati per testare i sistemi bilingue di traduzione vocale conversazionale. "Hai bisogno di dati di alta qualità per avere test di alta qualità", ha affermato Federmann.
Il team Microsoft spera che il corpus, che è liberamente disponibile, andrà a beneficio dell'intero campo della traduzione conversazionale e contribuirà a creare benchmark più standardizzati che i ricercatori possono utilizzare per misurare il loro lavoro contro gli altri.
"Questo aiuta a spingere il campo in avanti", ha detto Will Lewis, un principale Program Manager tecnico con il team di Microsoft Translator che ha lavorato anche sul progetto.
Scarica il corpus di traduzione lingua Microsoft Speech qui.
Ulteriori informazioni su questa release e altri modi in cui Microsoft sta lavorando per rendere l'intelligenza artificiale più intelligente e più accurata nel Blog di Microsoft Research.
Ulteriori informazioni