사용자 정의 음성 녹음, 번역 및 합성 이제 통합 음성 서비스에서 사용할 수
이번 주에 발표 된 통합 음성 서비스를 사용 하 여 앱, 워크플로 및 웹 사이트에 음성을 통합 합니다. 마이크로소프트 빌드. 음성은 기존 변환기 음성 api, Bing 음성 api 및 사용자 지정 음성 서비스 (미리 보기)의 기능을 통합 되 고 완벽 하 게 사용자 지정 가능한 서비스로 결합 합니다.
이제 동일한 구독을 사용 하 여 음성을 텍스트, 음성 번역 및 텍스트 음성 변환 서비스로 사용할 수 있습니다. 세 가지 서비스는 모두 미리 보기를 사용 하 여 사용자 지정할 수 있습니다. 새로운 사용자 지정 음성, 번역기 및 음성 기능, 또한//빌드에 이번 주 발표:
- 음성 대 텍스트 (음성 전사)-특정 어휘 또는 사용자의 말하기 스타일 (언어 모델 사용자 지정)에 맞춘 기본 또는 사용자 지정 모델을 사용 하 여 음성 오디오를 텍스트로 변환 하거나 배경과 같은 예상 환경과 더 잘 일치 노이즈 (어쿠스틱 모델 사용자 지정). 음성을 텍스트로 변환 하는 기술은 음성 명령, 실시간 전사 및 콜센터 로그 분석과 같은 광범위 한 사용 사례를 가능 하 게 합니다.
- 연설에 텍스트 (음성 합성)-이상 75 기본 음성, 또는 새로운 사용자 정의 음성 모델과 함께 거의 실시간으로 텍스트를 오디오로 변환 하 여 모든 응용 프로그램에 음성을 가져, 자신의 녹음에 맞게 독특하고 인식 브랜드 음성을 만듭니다.
- 음성 번역 – 신경망 기계 번역 (nmt) 기술을 기반으로 하는 모델을 사용 하 여 실시간 음성 변환 기능을 제공 합니다. 음성 변환 파이프라인의 세 가지 요소를 이제 사용자 지정할 수 있습니다: 음성 인식, 텍스트 음성 변환 및 기계 번역 합니다.
신경 번역 변환기 텍스트 API의 최신 버전 (버전 3)새 변환기 사용자 지정 기능을 사용 하 여 빌드된 사용자 지정 시스템을 사용할 수도 있습니다.
통합 음성 서비스는 현재 미리 보기로 제공 됩니다. 일반 공급 서비스를 필요로 하는 음성 번역의 경우 개발자는 계속 해 서 Microsoft 번역기 음성 API를 사용 해야 합니다. 마이크로 소프트 번역기를 따르십시오 블로그 그리고 지 저 귀 다 계속 하기 위한 페이지, 최신 Microsoft 번역기 서비스 알림.
자세한 내용은 인지 서비스 블로그.