Transcrição, tradução e síntese de fala personalizáveis agora disponíveis no serviço de fala unificada
Integre a fala em seus aplicativos, fluxos de trabalho e sites usando o serviço unificado Speech, anunciado esta semana na Microsoft Build. Speech combina os recursos da API Translator Speech existente, da API Bing Speech e do Custom Speech Service (visualização) em um serviço unificado e totalmente personalizável.
Agora você pode usar os serviços de conversão de fala em texto, tradução de fala e conversão de texto em fala com a mesma assinatura. Todos os três serviços podem ser personalizados usando a visualização do Novos recursos personalizados de fala, tradutor e voz, também anunciado esta semana na //build:
- Speech to Text (Transcrição de fala) - conversão de áudio falado em texto com modelos padrão ou personalizados, adaptados ao vocabulário específico ou aos estilos de fala dos usuários (personalização do modelo de linguagem) ou para melhor corresponder ao ambiente esperado, como ruído de fundo (personalização do modelo acústico). A tecnologia de fala para texto permite uma ampla gama de casos de uso, como comandos de voz, transcrições em tempo real e análise de registros de call center.
- Text to Speech (Síntese de fala) - Dê voz a qualquer aplicativo convertendo texto em áudio quase em tempo real com a opção de mais de 75 vozes padrão ou com os novos modelos de voz personalizados, criando uma voz de marca exclusiva e reconhecível, ajustada às suas próprias gravações.
- Tradução de fala - oferece recursos de tradução de fala em tempo real com modelos baseados em tecnologias de tradução automática neural (NMT). Três elementos do pipeline de tradução de fala agora podem ser personalizados: reconhecimento de fala, texto para fala e tradução automática.
Traduções neurais com a versão mais recente da API de texto do Translator (versão 3)Além disso, é possível usar sistemas personalizados criados com o novo recurso Translator Custom.
O serviço de fala unificado é oferecido atualmente como uma prévia. Para a tradução de fala que requer um serviço em Disponibilidade Geral, os desenvolvedores devem continuar a usar a API de fala do Microsoft Translator. Siga as instruções do Microsoft Translator blog e Twitter para obter anúncios de serviço contínuos e atualizados do Microsoft Translator.
Saiba mais sobre o Blog dos Serviços Cognitivos.