Strojno prevajanje skupina na Microsoft Research
Microsoft Research ' s Machine Translation (MSR-MT) skupina je bila med vodilnimi raziskovalnimi organizacijami v prostoru strojno prevajanje za več kot 8 let, in nekatere temeljno delo v naravnem jeziku obdelave na MSR začel več kot 16 leti. Ekipa pristop k strojno prevajanje vključuje jezikovne značilnosti z najsodobnejšimi statističnimi strojno prevajanje algoritmi. Osredotočenost ekipe je bila vedno na samodejno pridobivanje prevajalskega znanja iz dvojezičnih corpora, to je vzporednih podatkov, sestavljenih iz izvirnih stavkov izvornega jezika in njihovih ustreznih prevodov s strani človeških prevajalcev. Približno 3 leti, je pozornost ekipe premaknilo iz povsem pravila, ki temelji pristop k tej nalogi v smeri hibridnega pristopa, ki vključuje obsežno statistično obdelavo, ki omogoča večjo razširljivost po področjih in v nove jezike.
Microsoftova strojna prevajalska tehnologija je bila prvič razvita za namene lokalizacije za Omogočajo naši organizaciji za podporo strankam, da objavijo tehnične podporne dokumente s frekvenco in jezikovno širino, ki bi bila nedopustno drago uporabo človeških prevajalcev. Z vsemi Microsoft prej ljudi prevedenih dokumentov in lokalizirane programske opreme na voljo, MT ekipa je lahko samodejno usposobiti svoj statistični MT motor, da se doseže precej dobre kakovosti v tehničnem področju. Ta tehnologija je bila razširjena tako, da podpira ekipo lokalizacije sistema Windows, oddelek za razvijalce, MSDN in več drugih skupin znotraj Microsofta. Prav tako je Microsoftu omogočil, da je dosegel veliko več strank, kot bi jih kdajkoli bilo mogoče uporabiti samo s človeškim prevodom.
Po osredotočanju na Microsoftove potrebe po prevajanju je skupina začela graditi prilagodljivo spletno storitev, ki bi ji omogočala zagotavljanje prevajalskih storitev širši javnosti, kot samostojno orodje na spletu in kot značilnost v drugih izdelkih. Glede na to, da je bil motor Microsoft MT najbolj usposobljen za tehnične podatke, še ni bil uglašen za prevajanje besedila v drugih domenah predmetov. Vendar upamo, da bomo še naprej izboljšujemo kakovost in širino motorja. Veselimo se delitve našega razvoja z vami v prihodnjih mesecih na tem blogu.
-Kaj je to?