Microsoft Tradutor publicamente libera o corpus de tradução de fala
Christian Federmann, gerente de programa sênior |
Como parte de um esforço contínuo dentro da Microsoft para melhorar a precisão dos sistemas de inteligência artificial (ia), o Microsoft Translator está lançando publicamente um conjunto de dados que inclui várias conversas entre falantes bilíngues que estão falando francês, Alemão e inglês.
Este corpus, que foi produzido pela Microsoft usando falantes bilíngues, tem como objetivo criar um padrão pelo qual as pessoas possam medir o quão bem seus sistemas conversacionais de tradução de fala funcionam. Ele pode servir como um conjunto de dados padronizado para testar sistemas de tradução de fala bilíngües, como o Recurso ao vivo do Microsoft Translator e Tradutor Skype.
Christian Federmann, um gerente de programa sênior que trabalha com a equipe do Microsoft Translator, disse que não há tantos conjuntos de dados padronizados para testar sistemas de tradução de voz bilíngues de conversação. "Você precisa de dados de alta qualidade para ter testes de alta qualidade", disse Federmann.
A equipe da Microsoft espera que o corpus, que está disponível gratuitamente, beneficiará todo o campo de tradução conversacional e ajudará a criar benchmarks mais padronizados que os pesquisadores podem usar para medir seu trabalho contra outros.
"Isso ajuda a impulsionar o campo para a frente", disse Will Lewis, um gerente de programa técnico principal com a equipe do Microsoft Translator que também trabalhou no projeto.
Baixe o corpus de tradução de linguagem de fala da Microsoft aqui.
Saiba mais sobre esta versão, bem como outras maneiras pelas quais a Microsoft está trabalhando para tornar a ia mais inteligente e mais precisa no Blog da Microsoft Research.
Saiba Mais