翻訳品質のテスト: ゲストブログ
アナンド Chakravarty は、過去2.5 年の機械翻訳チームの SDET で、8年間マイクロソフトに勤務しており、mt チームの最初の製品テスターでした (そして、「まだ mt のテストを楽しんでいます」)。 今日のゲストブログでは、翻訳品質のテストについて説明します。
—————————————————————————————————————
翻訳システムの品質を検証することについて話しているときに、最初に考えられる点の1つは、どのように品質を測定するのか、または正確には、翻訳の精度ですか?コンピュータを使用して人間の言語間の翻訳は、ほぼ半世紀の古いフィールドです。この領域は、現在利用可能な最高の機械翻訳システムであっても、完全に満足できる言語品質を得るには近づきません。
課題の一部は、話し言葉/書き言葉の意味を理解するために人間が処理するさまざまなデータポイントです。構文、パース、セマンティクス、文脈、曖昧さ回避、並び替えなどがあり、そのすべてが文を理解することになります。そして、これは1言語の文にすぎません。次に、このすべてを適用して、別の言語で文を再構築し、同じ意味を持つようにします。
いくつかの例は、この点を明確にするのに役立ちます。「オリンピック2008」という用語は、かなり明白です。同様に、「選挙2008」という用語は、米国の大統領選挙を意味すると予想するかもしれません。ただし、ユーザーがカナダからのものである場合は、その地域の選挙を参照する可能性が高くなります。
より一般的で、より一般的な例は、「メモが間違っていた」のような文です。「注意」という言葉は、有益なメッセージまたは音楽的な用語への参照ですか?適切な翻訳は文脈に依存します。より多くの文脈を使用し、より正確な翻訳を得る可能性が向上します。ただし、システムが取得しようとするコンテキストが多くなるほど、パフォーマンスが低下します。スマートシッピングの決定には、翻訳の正確性を向上させ、ユーザーに対して実行可能な翻訳結果を提供するという正しいバランスをとることが含まれます。もちろん、どちらも重要です。重要なのは、ユーザーにとって最終的な結果がどの程度役に立つかに応じて、どのように改善に取り組むかを理解することです。
これは、個々の文章ではなく、文書や web ページを翻訳するときに特に興味深いものになります。100の文章を含むウェブページの翻訳依頼が届いたとしましょう。翻訳システムのアーキテクチャに応じて、これらの文章はすべて1つのプロセスに行くか、複数のプロセス/マシンに分散させることができます。いずれにせよ、このページ全体を翻訳するのにかかる時間は、文章を翻訳するのに要した最大時間に比例していることは明らかです。その投資時間がユーザーの時間に悪影響を及ぼす前に、どのくらいの期間、文の翻訳を費やしていますか?最高の翻訳を追求するために、翻訳依頼に対して有益な情報を得ることを妨げることになるかもしれません。このため、システムの有用性は、言語の品質とアプリケーションのパフォーマンスのバランスをとるために行われる決定によって決まります。
マイクロソフトの翻訳者向け製品には、一般に公開されている翻訳製品の中でもユニークな、バイリンガルビューアの追加機能があります。これは、並列テキストの強調表示、同期されたスクロールをサポートし、プログレッシブレンダリングでページを提示します。これは、我々のユーザーが見るものに別の層を追加します, その結果、研磨し、仕上げに別の層.
今後数週間で、最高品質の翻訳システムを出荷するためにテストされている特定の分野の詳細をお届けしたいと考えています。この問題についての質問を投稿して自由に感じます, あなたは常に質問したかったもの:-), コメント欄で.