跳轉至主要內容
線上翻譯

微軟翻譯博客

微軟研究公司機器翻譯小組

微軟研究的機器翻譯 (msr-mt) 集團已經成為機器翻譯領域的領先研究機構之一超過 8年, msr 在自然語言處理方面的一些基礎工作始于16年前。該團隊的機器翻譯方法將語言功能與最先進的統計機器翻譯演算法集成在一起。該團隊的重點一直是自動從雙語語料庫中獲取翻譯知識, 即由原始來源語言句子及其相應翻譯組成的並行資料。大約3年前, 團隊的重點從純粹基於規則的方法轉向包括廣泛統計處理的混合方法, 從而實現跨域和新語言的更大可擴充性。

微軟的機器翻譯技術最初是為內部當地語系化目的而開發的, 允許 我們的客戶支援組織以使用人工翻譯人員的頻率和語言範圍發佈技術支援文檔, 成本高得令人望而卻步。 憑藉 microsoft 以前的所有人工翻譯文檔和當地語系化軟體, mt 團隊能夠自動培訓其統計 mt 引擎, 從而在技術領域實現相當好的品質。 此技術已擴展到支援 windows 當地語系化團隊、開發人員部門、msdn 和 microsoft 內部的其他幾個組。這也讓微軟能夠接觸到比僅僅使用人工翻譯所能達到的更多的客戶。

在關注了 microsoft 自身的翻譯需求後, 該團隊開始構建可擴展的 web 服務, 使其能夠向公眾提供翻譯服務。 獨立工具 在網路上, 並作為其他產品中的一項功能。 鑒於 microsoft mt 引擎在技術資料方面的培訓最多, 因此尚未對其進行調整, 以便在其他主題領域翻譯文本。 不過, 我們希望繼續提高發動機的品質和廣度。我們期待著在未來幾個月的時間裡在這個博客上與大家分享我們的發展。

–希瑟

希瑟·索恩是微軟研究機器翻譯小組的業務戰略總監