Doorbraken in het vertalen van spraak van onze onderzoeksteams
Dit is het jaar van de machine leren en grote gegevens. Of het nu gaat voorspellen politieke resultaten, superchargen uw Excel-spreadsheetsHelpen kaart queries voor intentie op zoek, of zelfs een Vertaal engine aanpassen om het beste past bij uw inhoud-deze onderzoeksgebieden spelen een hoofdrol in de transformatie van technologie en productiviteit.
Een paar weken terug, op de 14e jaarlijkse Computing in de 21e eeuw conferentie, deelnemers zag een glimp van waar anders deze technologieën nemen ons-en vond het geweldig. Rick Rashid, die hoofden van Microsoft Research wereldwijd, ging op het podium en in de span van acht zinnen, kreeg de 2000 + sterke menigte op hun voeten en juichen. Het was een moment waar technologie was niet te onderscheiden van magie -en een die zou aansporen Science Fiction schrijvers om te beginnen denken aan grotere uitdagingen voor onderzoekers aan te pakken 🙂
Bekijk de video om zelf te zien:
Een combinatie van krachtige technologieën werden gebruikt om deze verbazingwekkende demonstratie mogelijk te maken: Deep neuraal netwerk gebaseerde verwerking in combinatie met High Performance Computing toegestaan een significante sprong in de nauwkeurigheid van spraakherkenning. De Microsoft Translator-technologie die u gebruikt elke dag was Aangepaste om de toespraak van Rick te best passen inhoud. Nieuwe spraaksynthese technologie die het mogelijk maakt personalisatie van akoestische kenmerken was in staat om "stem van Rick" te creëren in een taal die hij niet spreekt. U lezen van Rick blog post hier.
Sommige van deze technologieën zijn nu al beschikbaar, met name de toonaangevende vertaling (Microsoft Translator) met aanpassingsmogelijkheden (Vertaler hub). Als u een Windows Phone-gebruiker bent, geniet u van de meest innovatieve vertaling app op elke telefoon voor meer dan een jaar nu, die een vroege toespraak vertaling ervaring die is afgestemd op reis situaties omvat. De audio-uitgang die u hoort op Bing vertaler website maakt gebruik van een aantal van de nieuwere spraaksynthese motoren coming out van onze toespraak onderzoek. Deep-neurale-net onderzoek is ook achter onze audio/video Indexing service- MAVIS, die commercieel beschikbaar is.
De opwinding die is Kabbelend Over De Web in antwoord op deze demonstratie is een indicatie van hoeveel iedereen wil deze ' magie ' ervaring. Er is veel werk te doen, maar u zult de voordelen van dit verbazende onderzoek in onze producten in onze toekomstige versies zien.
(Dendi
Directeur
Microsoft/Bing Translator & Microsoft onderzoek