Overslaan naar hoofdinhoud
Translator
Deze pagina is automatisch vertaald door de machine vertaalservice van Microsoft Translator. Meer informatie

Microsoft Translator Blog

Microsoft Translator publiekelijk releases speech vertaling corpus

christian_federmann
Christian Federmann, senior programmamanager

Als onderdeel van een voortdurende inspanning binnen Microsoft om de nauwkeurigheid van de kunstmatige intelligentie (AI) systemen te verbeteren, is Microsoft Translator publiekelijk vrijgeven van een set van gegevens die meerdere gesprekken tussen tweetalige sprekers die spreken Frans omvat, Duits en Engels.

Dit corpus, dat werd geproduceerd door Microsoft met behulp van tweetalige sprekers, heeft tot doel een standaard te creëren waarmee mensen kunnen meten hoe goed hun conversationele spraak vertaalsystemen werken. Het kan dienen als een gestandaardiseerde data set voor het testen van tweetalige conversationele spraak vertaling systemen, zoals de Microsoft Translator live functie En Skype vertaler.

Christian Federmann, een senior programmamanager werken met de Microsoft Translator team, zei dat er niet zo veel gestandaardiseerde datasets voor het testen van tweetalige conversationele spraak vertaling systemen. "Je moet kwalitatief hoogwaardige gegevens met het oog op een hoge kwaliteit testen hebben," zei Federmann.

De Microsoft-team hoopt dat het corpus, die vrij beschikbaar is, zal het hele gebied van conversationele vertaling ten goede komen en helpen om meer gestandaardiseerde benchmarks die onderzoekers kunnen gebruiken om hun werk te meten tegen anderen te creëren.

"Dit helpt voortbewegen van het veld naar voren," zei Will Lewis, een belangrijke technische programmamanager bij het Microsoft Translator team, die ook aan het project werkte.

Download de Microsoft Speech taal vertaling corpus Hier.

Meer informatie over deze release en andere manieren waarop Microsoft werkt om AI slimmer en nauwkeuriger te maken in de Microsoft Research Blog.

 

Meer informatie