Azure AIカスタム翻訳者ニューラル辞書:より高い専門用語の翻訳品質を実現
本日、翻訳品質を大幅に向上させるニューラル辞書のリリースを発表できることを大変嬉しく思います。このブログポストでは、ニューラル辞書機能についてご紹介します。
はじめに
ニューラル・ディクショナリーは、私たちの辞書を拡張したものである。 ダイナミック辞書 そして フレーズ辞書 Azure AI Translatorの機能です。どちらも、ユーザーが特定の用語やフレーズに対して独自の翻訳を提供することで、翻訳出力をカスタマイズすることができます。私たちの以前の方法では、逐語辞書を使用していましたが、これは正確な検索と置換操作でした。ニューラル辞書は、機械翻訳モデルに用語と文脈の両方を調整させて、より流暢な翻訳を生成することで、1つ以上の用語の翻訳を含む文の翻訳品質を向上させます。同時に、高い用語の翻訳精度を維持する。
次の英語-ドイツ語の例は、カスタム用語の翻訳が要求された場合の、両方の方法による翻訳出力の違いを示しています:
インプット: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
バーベイタム辞書: | 基礎知識 デア レゲルマEs テストエン |
ニューラル辞書: | 基礎知識 デス レゲルマエン テストアンズ |
品質向上
下図は、一般に公開されている自動車業界用語のテストセットにおける新機能の大幅な改善を示している。https://aclanthology.org/2021.eacl-main.271)、健康(https://aclanthology.org/2021.emnlp-main.477)とCovid-19ドメイン(https://aclanthology.org/2021.wmt-1.69)の一般的な翻訳モデルを使用しています。
また、Custom Translatorプラットフォームとニューラル辞書モデルについて、一連の顧客評価を実施しました。ニューラル辞書を拡張したモデルと拡張していないモデルの間で、顧客データの翻訳品質の向上を測定しました。5人の顧客が参加し、ドイツ語、スペイン語、フランス語の異なるビジネスドメインをカバーしました。
以下のグラフは、平均改善率を示している。 コメット 左が一般的なモデル、右がカスタマイズされたモデル。青のカラーバーはニューラル辞書を使用しない場合の一般的な翻訳品質を、オレンジのカラーバーはニューラル辞書を使用した場合の翻訳品質を表しています。これらは、テストセット全体に対する全体的な平均改善です。1つ以上の顧客辞書項目(19%~63%)を含むセグメントでは、+6.3~+12.9 COMETポイントと高い改善率を示しています。
サポート言語
- 現在利用可能(2023年12月6日現在):中国語(簡体字)、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポーランド語、ロシア語、スペイン語、スウェーデン語 - 英語との行き来。
- 今後も追加していく予定です。最新情報は Custom Translatorのリリースノート.
ニューラル辞書の仕組み
ニューラル辞書は、カスタム用語の翻訳を処理する際、正確な検索と置換操作を採用しない。その代わりに、文脈全体に最も適合する方法で、辞書の用語や語句を翻訳する。これは、用語が屈折したり、大文字と小文字が異なったり、周囲の単語が調整されることで、より流暢で首尾一貫した翻訳ができることを意味する。
例えば、次のような英語の入力文があり、辞書のフレーズを使わずにポーランド語に訳すとします:
インプット: | 理解しやすく、迅速な解決策が必要だ。 |
標準的な翻訳: | このような場合、このような弊害が発生する可能性があります。 |
もし "solution "が "解決策 "と訳されていることを確認したいのであれば。オルタナティワ"(英語では "an alternative")というダイナミックな辞書アノテーションを追加することができる:
インプット: | We need a fast <mstrans:dictionary translation=”オルタナティワ“>solution</mstrans:dictionary> that will be understandable. |
バーベイタム辞書: | ポトフスキーエゴ オルタナティワktóry (英語)y. |
ニューラル辞書: | ポトフスキーej オルタナティヴワイktórA (英語)A. |
以前の方法によって生成された出力は、文法的な性別の一貫性に違反しているため、流暢ではない。ニューラル辞書は、a) 要求された置き換えを屈折させ、b) 必要に応じて周囲の単語を変更することで、流暢な出力を生成する。また、次の例のように、ケーシングを変更することもできる:
インプット: | This company’s <mstrans:dictionary translation=”アックジェ“>stock</mstrans:dictionary> is cheap. |
バーベイタム辞書: | アックジェ テジ・ファーミー 冗談 タニ. |
ニューラル辞書: | アクチェ テジ・ファーミー S タニー. |
ニューラル辞書は、要求された用語の翻訳が基本文法形式で提供されることを期待する。複数単語の用語もサポートされ、名詞句として提供される必要がある。つまり、単語は独立してレ マト化されるべきではない(たとえば、「Estonian parliamentary election(エストニア議会選挙)」は「Estonia parliament election(エストニア議会選挙)」よりも優れている)。
ニューラル辞書を有効にする方法
上記のすべてのサポート言語について、ニューラル辞書は、Custom Translatorプラットフォームを使用しているすべてのお客様で、すぐにご利用いただけます。 フレーズ辞書.ニューラル辞書を有効にするには、完全な(または辞書のみの)カスタムモデルの再トレーニングが必要です。
推薦の言葉
- ニューラル辞書を使用する際に、フレーズ辞書項目がより頻繁に使用されるようにしたい場合は、フ レーズ項目をさまざまな形式でソース部分と一緒に追加することを検討してください。上記の例では、"solution _"の横に オルタナティワ"であれば、以下の項目も追加するとよいだろう:「解決策 オルタナティワ"、"ソリューション オルタナティヴ", "ソリューション オルタナティヴ".
- フレーズ辞書を使用する際に、特定の単語やフレーズが入力テキストから出力訳文に「そのまま」コピーされることを保証することが目的であれば、逐語辞書を強制することを検討してください。
- よく使われる単語やフレーズの翻訳をフレーズ辞書に追加するのは避けましょう。
Custom Translatorの詳細と、グローバル市場でビジネスを成功させる方法については、まず Custom Translatorビギナーズガイド.
Microsoft Custom Translatorでできること
ドメイン固有の用語でカスタムモデルを構築し、リアルタイムに翻訳することができます。 マイクロソフト翻訳 API.
使用 マイクロソフトカスタムトランスレーター は、お客様のビジネスのグローバル化と顧客との対話の向上を支援する翻訳ソリューションです。
詳しくは、以下のサイトをご覧ください。 Microsoft Translatorのビジネスソリューション そして Custom Translatorのリリースノート.