ユニファイドスピーチサービスで、カスタマイズ可能な音声転写、翻訳、および合成を利用できるようになりました。
ユニファイド音声サービスを使用して、アプリ、ワークフロー、および web サイトに音声を統合し、今週発表された マイクロソフトビルド.音声は、既存の翻訳者音声 API の機能を組み合わせたものです。 Bing 音声 API とカスタム音声サービス (プレビュー) を統一し、完全にカスタマイズ可能なサービスに移行します。
これで、音声をテキスト、音声翻訳、およびテキストを同じサブスクリプションで音声サービスに使用できます。すべての3つのサービスのプレビューを使用してカスタマイズすることができます 新しいカスタム音声、翻訳、音声機能, また、//build で今週発表:
- テキストへの音声 (音声のトランスクリプション)-デフォルトまたはユーザーの特定の語彙やスピーキングスタイルに合わせたカスタムモデル (言語モデルのカスタマイズ)、またはより良い背景などの予想される環境に一致するように音声オーディオをテキストに変換ノイズ (音響モデルのカスタマイズ)。音声読み上げ技術を使用すると、音声コマンド、リアルタイムトランスクリプション、コールセンターログ分析などの幅広いユースケースが可能になります。
- 音声へのテキスト (音声合成)-75 のデフォルトの声、または新しいカスタム音声モデルとの選択と近いリアルタイムでオーディオにテキストを変換することによって任意のアプリに声をもたらす、独自の録音にチューニングされたユニークで認識できるブランドの声を作成する。
- 音声翻訳–ニューラルマシン変換 (NMT) 技術に基づくモデルによるリアルタイム音声翻訳機能を提供します。音声翻訳パイプラインの3つの要素をカスタマイズできるようになりました: 音声認識、音声と機械翻訳へのテキスト。
神経翻訳 翻訳テキスト API の最新バージョン (バージョン 3)、新しいトランスレータカスタム機能を使用して構築されたカスタムシステムを使用することもできます。
ユニファイドスピーチサービスは現在、プレビューとして提供されています。一般的な可用性でサービスを必要とする音声翻訳の場合、開発者は引き続き Microsoft トランスレータ音声 API を使用する必要があります。マイクロソフトの翻訳に従ってください ブログ そして Twitter 継続するためのページ, 最新のマイクロソフト翻訳サービスのお知らせ.
詳細については、 認知サービスのブログ.