Настраиваемая транскрипция речи, перевод и синтез теперь доступны в единой речевой службе
Интеграция речи в ваши приложения, рабочие процессы и веб-сайты с помощью единой речевой службы, объявленной на этой неделе Microsoft Build. Речь объединяет возможности существующего речевого интерфейса переводчика, речевого API Bing и пользовательской речевой службы (Preview) в единую и полностью настраиваемую службу.
Теперь можно использовать голосовые функции для преобразования текста, речи и текста в речевые службы с той же подпиской. Все три услуги могут быть настроены с помощью предварительного просмотра новые пользовательские функции распознавания речи, переводчика и голоса, также объявил на этой неделе в//буилд:
- Речь к тексту (транскрипция речи)-преобразование поговоренного тональнозвукового к тексту с по умолчанию или изготовленные на заказ модели приспособленные к специфическому словарю или говоря типам потребителей (адаптация модели языка), или для того чтобы более лучше сопрягать ожидаемую окружающую среду, как с предпосылкой шум (Настройка акустической модели). Технология распознавания речи в тексте позволяет использовать широкий спектр вариантов использования, таких как голосовые команды, транскрипции в реальном времени и анализ журнала Call-центра.
- Текст к речи (синтез речи)-приносить голос к любому app путем преобразовывать текст к тональнозвуковому в почти реальное временя с выбором над 75 голосами по умолчанию, или с новыми изготовленными на заказ моделями голоса, создающ уникально и узнаваемый голос тавра настроенный к вашим собственным записям.
- Перевод речи – предоставление возможностей перевода речи в реальном времени с моделями, основанными на технологиях перевода нейронных машин (NMT). Теперь можно настраивать три элемента конвейера преобразования речи: распознавание речи, преобразование текста в речь и машинный перевод.
Нейронные переводы с Новейшая версия текстового API переводчика (версия 3), также можно использовать пользовательские системы, созданные с помощью новой пользовательской функции транслятора.
В настоящее время в качестве предварительного просмотра предлагается единая речевая служба. Для перевода речи, требующего службы в общей доступности, разработчики должны продолжать использовать речевой API Microsoft Translator. Пожалуйста, следуйте инструкциям переводчика Microsoft Блог И Щебетать страница для продолжения, актуальные объявления службы переводчика Microsoft.
Подробнее о Когнитивные услуги блог.