Skupina strojového překladu na webu Microsoft Research
Skupina strojového překladu společnosti Microsoft (MSR-MT) patří mezi přední výzkumné organizace v prostoru strojového překladu po dobu více než 8 let a některé z hlavních činností v oblasti zpracování přirozeného jazyka v MSR začaly před více než 16 lety. Týmová koncepce strojového překladu integruje jazykové funkce s nejmoderněji statistickými algoritmy pro statistické stroje. Tým se vždy zaměřil na automatické získávání překladů z dvojjazyčných korporálů, což jsou paralelní data skládající se z původních vět zdrojového jazyka a jejich odpovídající překlady od lidských překladatelů. Před 3 lety se zaměření týmu přesunulo z čistě právního přístupu k tomuto úkolu směrem k hybridnímu přístupu, který zahrnuje rozsáhlé statistické zpracování, což umožňuje větší škálovatelnost napříč doménami a do nových jazyků.
Technologie společnosti Microsoft pro překlady strojů byla poprvé vyvinuta pro účely interní lokalizace pro Povolit naší organizaci podpory zákazníků publikovat dokumenty technické podpory s frekvencí a šířkou jazyka, které by byly s využitím překladatelů příliš nákladné. Díky veškerým dříve člověkem přeložovaným dokumentům společnosti Microsoft a lokalizovanému softwaru, který měl k dispozici, byl tým MT schopen automaticky trénovat svůj statistický motor MT, aby v technické oblasti dosáhl poměrně dobré kvality. Tato technologie byla rozšířena na podporu týmu lokalizace systému Windows, divize vývojářů, webu MSDN a několika dalších skupin v rámci společnosti Microsoft. Společnost Microsoft také umožnila, aby dosáhla mnohem více zákazníků, než by kdy mohla použít samotný lidský překlad.
Poté, co se soustředil na vlastní překladatelské potřeby společnosti Microsoft, začal tým vytvářet škálovatelnou webovou službu, která by jí umožnila poskytovat překladatelské služby pro širokou veřejnost, jako samostatný nástroj na webu a jako funkci v rámci jiných produktů. Vzhledem k tomu, že modul Microsoft MT byl velmi intenzivně vycvičen v technických údajích, nebyl dosud naladěn pro překlad textu v jiných doménách předmětů. Doufáme však, že budeme pokračovat ve zlepšování kvality a šířky motoru. Těšíme se na náš vývoj s vámi v nadcházejících měsících v tomto blogu.
– Heather