メイン コンテンツへスキップ
Translator
このページは、マイクロソフト翻訳者の機械翻訳サービスによって自動的に翻訳されました。 詳細情報

マイクロソフト翻訳ブログ

Microsoft 音声サービスを使用して、エンドツーエンドの音声翻訳を製品に統合

マイクロソフトの音声サービスが一般公開されるようになりました。Azure Cognitive Services の一部である Speech は、一連の統合されたカスタマイズ可能なサービスで、音声認識、翻訳、音声合成などの完全な音声機能を提供します。既存のマイクロソフト翻訳者音声 API の機能を組み合わせたものです。 Bing 音声 API とカスタム音声サービス (プレビュー)。

音声は、プロトタイピングからプロダクションまで、お客様のニーズに合わせてエンタープライズ対応と拡張性を備えています。これは、アプリ、web サイト、およびワークフローに追加することができます Azure サブスクリプション。

スピーチは、音声から音声への翻訳言語を11に対応しています。これらの11の言語のいずれかからの音声も60以上のテキスト言語に翻訳することができます。 翻訳、音声認識、および音声合成でサポートされている言語の一覧が、 音声サービスのドキュメント.

カスタマイズ可能なエンド・ツー・エンドのソリューション

マイクロソフトの翻訳者スピーチ API と同様に、音声翻訳サービスは、1つの統合サービスで音声翻訳に必要なすべての要素を組み合わせたものです: TrueText テキストの正規化、テキストの翻訳を含む音声認識マイクロソフトの翻訳者サービス、およびテキストへのスピーチ。

さらに、音声翻訳は、入力音声認識から翻訳、出力テキスト読み上げまで、各レベルでカスタマイズできます。

音声認識と TrueText 正規化: 音声音声をテキストに変換する

音声オーディオは処理され、raw テキスト出力に変換します。音声が変換されると、TrueText はテキストを正規化し、翻訳に適したものにします。TrueText は、音声言いよどみ ("um" s と "ah" s)、吃音、および繰り返しなどのフィラーの単語を削除します。テキストは、改行、適切な句読点、および大文字小文字を追加することによって、より読みやすく翻訳できます。

音声認識を使用してカスタマイズすることができます カスタムスピーチ.カスタム音声では、ユーザーは独自の語彙とユニークなスピーキングスタイルに合わせたカスタム言語モデルを構築することができます。カスタム音響モデルはまた、音声認識は、さまざまなマイク、サンプリングレートやバックグラウンドノイズに適応できることを確認するためにユーザーの環境に適応するために作成することができます。

機械翻訳: テキストを翻訳する

変換されたテキストは、特別に実生活で話されている会話のために開発した神経機械翻訳を使用して翻訳します。

カスタムトランスレータ プレビュー ユーザーは、企業や業界で使用される用語を理解する1つに翻訳者の神経翻訳システムをカスタマイズすることができます。

カスタムトランスレータでカスタマイズされたシステムは、音声翻訳とテキスト翻訳の両方に使用できます。 マイクロソフトの翻訳者のテキスト API.

テキスト読み上げ: 翻訳されたテキストから音声を生成する

音声合成では、翻訳されたテキストからコンピュータが生成したオーディオ出力を作成します。ユーザーは、男性と女性の声のためのオプションを含む45以上の言語またはロケールで75以上の声から選ぶことができます。

カスタムボイス、ユーザーは、トレーニングデータの記録とアップロードによって音声をカスタマイズすることもできます。このサービスは、録音に合わせて調整された一意の音声を作成します。

ユニファイドスピーチの開始

サービスのユニファイドスピーチの詳細については、 Azure ページ.そこでは、30日間の試用版のキーを無料でマイクロソフトのユニファイド音声サービスをテストすることができます Azure ポータル.

スピーチのためのドキュメンテーションは利用できる ここは、クイックスタート、チュートリアル、およびアプリへのサービスの追加に役立つガイドの方法について説明しています。

今すぐ無料でマイクロソフトのスピーチを始める。