การถอดรหัสคำพูดที่ปรับแต่งได้, การแปลและการสังเคราะห์ในขณะนี้มีอยู่ในบริการการพูดแบบรวม
ผสานการพูดเข้ากับแอปเวิร์กโฟลว์และเว็บไซต์ของคุณโดยใช้บริการเสียงพูดแบบรวมประกาศสัปดาห์นี้ที่ ไมโครซอฟท์สร้าง. คำพูดรวมความสามารถของ API คำพูดของนักแปลที่มีอยู่, API คำพูด Bing และบริการคำพูดที่กำหนดเอง (แสดงตัวอย่าง) ลงในบริการแบบครบวงจรและปรับแต่งอย่างเต็มที่
ขณะนี้คุณสามารถใช้เสียงพูดเป็นข้อความการแปลคำพูดและข้อความไปยังบริการเสียงพูดด้วยการสมัครใช้งานเดียวกัน บริการทั้งสามแบบสามารถปรับแต่งได้โดยใช้ตัวอย่างของ คำพูดที่กำหนดเอง, แปลและคุณสมบัติเสียงยังประกาศในสัปดาห์นี้ที่//build:
- คำพูดเป็นข้อความ (การถอดเสียงด้วยคำพูด) –แปลงเสียงพูดเป็นข้อความที่มีรูปแบบเริ่มต้นหรือโมเดลที่กำหนดเองที่ปรับให้เหมาะสมกับคำศัพท์เฉพาะหรือรูปแบบการพูดของผู้ใช้ (การกำหนดรูปแบบภาษา) หรือเพื่อให้ตรงกับสภาพแวดล้อมที่คาดไว้เช่นกับพื้นหลัง เสียง (การปรับแต่งแบบจำลองอะคูสติก) การพูดเป็นเทคโนโลยีข้อความช่วยให้หลากหลายของกรณีการใช้งานเช่นคำสั่งเสียง, ทานแบบเรียลไทม์, และการวิเคราะห์บันทึกศูนย์การโทร.
- ข้อความที่จะพูด (การสังเคราะห์เสียงพูด) –นำเสียงไปยัง app ใดๆโดยการแปลงข้อความเสียงในเวลาจริงใกล้กับทางเลือกของมากกว่า๗๕เสียงเริ่มต้น, หรือด้วยรูปแบบเสียงที่กำหนดเองใหม่, การสร้างแบรนด์ที่ไม่ซ้ำกันและเป็นที่รู้จักเสียงที่ปรับให้เหมาะกับการบันทึกของคุณเอง.
- การแปลคำพูด–ให้ความสามารถในการแปลคำพูดแบบเรียลไทม์กับรูปแบบที่ขึ้นอยู่กับเทคโนโลยีการแปลของเครื่องระบบประสาท (NMT) คุณสามารถกำหนดองค์ประกอบสามส่วนของไปป์ไลน์การแปลคำพูดได้แล้ว: การรู้จำเสียงข้อความเป็นคำพูดและการแปลภาษาด้วยเครื่อง
การแปลของระบบประสาทด้วย รุ่นล่าสุดของการแปลข้อความ API (เวอร์ชัน 3)นอกจากนี้ยังสามารถใช้ระบบที่กำหนดเองที่สร้างขึ้นโดยใช้คุณลักษณะที่กำหนดเองของผู้แปลใหม่
บริการการพูดแบบครบวงจรถูกนำเสนอเป็นตัวอย่าง สำหรับการแปลคำพูดที่ต้องการบริการในความพร้อมใช้งานทั่วไปนักพัฒนาควรใช้ API คำแปลของ Microsoft ต่อไป กรุณาทำตามคำแปลของไมโครซอฟท์ บล็อก และ ทวิตเตอร์ เพจที่จะดำเนินการต่อได้จนถึงปัจจุบันประกาศบริการแปลของ Microsoft
เรียนรู้เพิ่มเติมเกี่ยวกับ บล็อกบริการทางปัญญา.