Перейти к основному контенту
Translator
Эта страница была автоматически переведена службой машинного перевода Microsoft Translator. Подробнее

Блог переводчика Майкрософт

Группа машинного перевода в Microsoft Research

Группа машинного перевода Microsoft Research (MSR-MT) была одной из ведущих исследовательских организаций в области машинного перевода уже более 8 лет, и некоторые фундаментальные работы по обработке естественного языка в MSR начались более 16 лет назад. Подход команды к машинному переводу объединяет лингвистические особенности с самыми современным алгоритмами статистического машинного перевода. Фокус команды всегда был на автоматически приобретать знания перевода от двуязычных кавернозных, т.е., параллельных данных состоя из первоначально предложений языка источника и их соответствующих переводов людскими переводчиками. Около 3 лет назад фокус команды сместился с чисто основанного на правилах подхода к этой задаче к гибридному подходу, включающему обширную статистическую обработку, позволяющую повысить масштабируемость между доменами и новыми языками.

Технология машинного перевода Microsoft была впервые разработана для целей локализации в Позволяют нашей Организации по поддержке клиентов публиковать документы технической поддержки с частотой и языковой широтой, которые были бы непомерно дорогостоящими с помощью переводчиков.  С помощью всех ранее переведенных человеком документов Microsoft и локализованного программного обеспечения в его распоряжении, команда MT смогла автоматически обучать свой статистический двигатель MT для достижения довольно хорошего качества в технической области.  Эта технология была расширена для поддержки группы локализации Windows, отдела разработчиков, MSDN и нескольких других групп в корпорации Майкрософт. Она также позволила корпорации Майкрософт охватить гораздо больше клиентов, чем когда-либо было бы возможно, используя человеческий перевод в одиночку.

После сосредоточения внимания на собственных потребностях Microsoft в переводе, группа начала создавать масштабируемые веб-службы, которые позволили бы ему предоставлять услуги перевода для широкой публики, как автономный инструмент в Интернете, и как функция в других продуктах.  Учитывая, что ядро Microsoft MT было обучено в основном на технические данные, он еще не был настроен для перевода текста в других предметных областях.  Тем не менее, мы надеемся продолжить улучшение качества и широты двигателя. Мы с нетерпением ждем обмена наши события с вами в ближайшие месяцы на этом блоге.

– Хизер

Хизер Торн является директором бизнес-стратегии в группе Microsoft Research машинного перевода