Microsoft Translator offentligt släpper tal översättning Corpus
Christian Federmann, Senior program chef |
Som en del av en pågående satsning inom Microsoft för att förbättra noggrannheten i AI-system (artificiell intelligens) publicerar Microsoft Translator offentligt en uppsättning data som innehåller flera konversationer mellan tvåspråkiga talare som talar franska, Tyska och engelska.
Denna Corpus, som producerades av Microsoft med tvåspråkiga talare, syftar till att skapa en standard genom vilken människor kan mäta hur väl deras konversations tal översättnings system fungerar. Det kan fungera som en standardiserad data uppsättning för att testa tvåspråkiga konversations tal översättnings system som Microsoft Translator funktionen live Och Skype översättare.
Kristna Federmann, en Senior program chef som arbetar med Microsoft Translator team, sade att det inte finns så många standardiserade data uppsättningar för att testa tvåspråkiga konversera tal översättnings system. "Du behöver högkvalitativa data för att få högkvalitativa tester," Federmann sa.
Microsoft-teamet hoppas att Corpus, som är fritt tillgänglig, kommer att gynna hela området konversera översättning och bidra till att skapa mer standardiserade riktmärken som forskarna kan använda för att mäta sitt arbete mot andra.
"Detta hjälper till att driva fältet framåt", säger Kommer Lewis, en huvud teknisk programansvarig med Microsoft Translator-teamet som också arbetade med projektet.
Data överför den Mikroskop tal språk översättning Corpus Här.
Läs mer om den här utgåvan och andra sätt som Microsoft arbetar på för att göra AI smartare och mer exakt i Microsoft Research-bloggen.
Lära sig mer