Arvuti tõlkerühm Microsoft Research
Microsoft Research ' s masin Translation (MSR-MT) rühm on olnud juhtivate uurimisorganisatsioonide masintõlke ruumi üle 8 aastat ja mõned foundational töö loodusliku keele töötlemise MSR algas üle 16 aastat tagasi. Meeskonna lähenemine masintõlke ühendab keelefunktsioone tipptasemel statistiline masin tõlge algoritme. Võistkonna fookus on alati olnud automaatselt tõlkimisega seotud teadmiste omandamine kakskeelne korpora, st paralleelsed andmed, mis koosnevad algupäraste keelte lausetest ja nende vastavatest tõlkest tõlkijate poolt. Umbes 3 aastat tagasi, meeskonna fookus nihkunud puhtalt reeglipõhine lähenemine sellele ülesandele hübriid lähenemine, mis sisaldab ulatuslikku statistilist töötlemist, võimaldades suuremat skaleeritavus erinevates valdkondades ja uutesse keeltesse.
Microsofti masintõlke tehnoloogia töötati esmakordselt välja in-House lokaliseerimine eesmärgil, Luba meie klienditoega organisatsiooni, et avaldada tehnilisi tugidokumente sageduste ja keeleseaga, mis oleks olnud inimeste tõlkijate abil takistavalt kulukas. Kõik Microsofti varem tõlgitud dokumente ja lokaliseeritud tarkvara tema käsutuses, MT meeskond suutis automaatselt treenida oma statistilise MT mootor saavutada üsna hea kvaliteediga tehnilist domeeni. See tehnoloogia laiendati, et toetada Windowsi lokaliseerimine meeskond, arendaja osakond, MSDN-i ja mitu muud rühma Microsoft. See on võimaldanud Microsoftil jõuda palju rohkem kliente, kui oleks kunagi olnud võimalik kasutada ainult inimese tõlge.
Pärast Microsofti enda tõlkevajaduste keskendumist hakkas meeskond ehitama skaleeritava veebiteenuse, mis võimaldaks tal pakkuda üldsusele tõlketeenuseid, kui eraldiseisev tööriist veebis ja funktsioonina muudes toodetes. Arvestades, et Microsoft MT mootor on kõige rohkem läbinud tehnilisi andmeid, ei ole seda veel häälestatud teksti tõlkimisel muudes valdkondades. Kuid loodame, et jätkame mootori kvaliteedi ja laiuse parandamist. Me ootame, et jagada oma arenguid teiega lähikuudel sellel blogis.
– Heather