Група машинного перекладу в Microsoft Research
Група з машинного перекладу Microsoft Research (MSR-MT) була однією з провідних дослідницьких організацій у просторі машинного перекладу протягом 8 років, а деякі з основоположних робіт з обробки природної мови на MSR почалися понад 16 років тому. Підхід команди до машинного перекладу об'єднує лінгвістичні функції з державними алгоритмами статистичної машинного перекладу. Фокус команди завжди був на автоматичне придбання перекладу знань з двомовного, тобто паралельні дані, що складаються з оригінальних речень із джерела мови та їх відповідних перекладів людськими перекладачами. Близько 3 років тому, фокус команди змістився з чисто правила основі підходу до цього завдання до гібридного підходу, який включає в себе широку статистичну обробку, що дозволяє більш широкої масштабованості в областях і на нових мовах.
Технологія машинного перекладу Microsoft була вперше розроблена для власних потреб у локалізації, Дозволити Наша організація підтримки клієнтів публікує документи технічної підтримки з частотою та широтою мови, які були б непомірно дорогими, використовуючи людські перекладачі. З усіма раніше людських перекладених документів і локалізованого програмного забезпечення в його розпорядженні, команда МТ змогла автоматично тренувати свій статистичний двигун MT для досягнення досить гарної якості в технічному домені. Ця технологія була розширена для підтримки команди локалізації Windows, відділу розробника, MSDN та кількох інших груп у межах корпорації Майкрософт. Вона також дозволила Microsoft досягти багато більше клієнтів, ніж коли-небудь було можливо, використовуючи людини перекладу поодинці.
Після фокусування на власних потребах Microsoft, команда почала будувати масштабовану веб-службу, яка дозволить йому надавати перекладацькі послуги широкій публіці, як автономний інструмент в Інтернеті, і в якості функції в межах інших продуктів. Враховуючи, що двигун Microsoft MT був навчений найбільш сильно на технічні дані, він ще не налаштований для перекладу тексту в інших предметних областях. Тим не менш, ми сподіваємося продовжити підвищення якості та широту двигуна. Ми з нетерпінням чекаємо обміну нашими подіями з вами протягом найближчих місяців на цьому блозі.
-Heather