Microsoft Þýðandi opinberlega losar ræðu þýðing corpus
Christian Federmann, eldri áætlun framkvæmdastjóri |
Eins og hluti af áframhaldandi fyrirhöfn innan Microsoft til að bæta nákvæmni gervigreind (AI) kerfi, Microsoft Þýðandi er opinberlega út hóp af gögnum sem inniheldur mörg samtöl á milli tveimur hátalara sem eru að tala frönsku, þýska og ensku.
Þetta corpus, sem var framleidd með því að Microsoft með tveimur ræðumaður, miðar að því að skapa standard sem fólk getur mál hversu vel þeirra samtals ræðu þýðing kerfi vinna. Það getur þjónað sem stöðluð gögnum til að prófa tveimur samtals ræðu þýðing kerfi eins og the Microsoft Þýðandi lifandi lögun og Skype Þýðandi.
Christian Federmann, háttsettur áætlun framkvæmdastjóri að vinna með Microsoft Þýðandi lið, sagði það eru ekki eins og margir stöðluð gögn setur til að prófa tveimur samtals ræðu þýðing kerfi. "Þú þarft hágæða gögn í því skyni að hafa hágæða próf," Federmann sagði.
Microsoft lið vonir corpus, sem er fáanleg, mun gagnast öllu sviði samtals þýðingu og hjálpa til við að búa til fleiri stöðluð viðmið sem vísindamenn getur notað til að mæla þeirra vinna gegn öðrum.
"Þetta hjálpar knýja sviði áfram," sagði Mun Lewis, skólastjóri tæknilega áætlun framkvæmdastjóri með Microsoft Þýðandi liðið sem vann líka á verkefninu.
Sæktu Microsoft Ræðu Tungumál Þýðing corpus hér.
Læra meira um þetta út eins og aðrar leiðir til að Microsoft er að vinna að gera AI klárari og betri í Microsoft Rannsóknir blogg.
Læra Meira