Siirry päähistoria
Kääntäjä
Microsoft Translatorin kone käännös palvelu on kääntänyt tämän sivun automaattisesti. Opi lisää

Microsoft Kääntäjä blogi

Microsoft Translator tuo loppu-to-end puheen käännös kaikille, joilla on maailman ensimmäinen Speech Translation API

Tänään julkaistiin uusi versio Microsoft Kääntäjä API joka lisää reaaliaikaista puhetta puheeksi (ja puhe tekstiksi) käännös valmiuksia olemassa olevaan tekstiin käännös API. Powered by Microsoftin State-of-the-Art tekoäly teknologiaa, tämä ominaisuus on ollut saatavilla miljoonille käyttäjille Skype yli vuoden ajan ja iOS Ja Android käyttäjille Microsoft Kääntäjä apps koska myöhään 2015. Nyt yritykset voivat lisätä näitä puheen käännös valmiuksia niiden sovelluksia tai palveluja ja tarjota enemmän luonnollisia ja tehokkaita käyttäjien kokemuksia asiakkailleen ja henkilö kunnalle.

Puheen kääntäminen on saatavilla kahdeksalle kielelle – arabia, Kiina mandariini, englanti, Ranska, Saksa, Italia, Portugali ja Espanja. Käännös tekstiksi on saatavilla kaikissa Microsoft Translator 50 + Tuetut kielet. Käännös puhuttua ääntä varten on saatavilla 18: lla tuetulla kielellä.

Nyt kuluva veres käännös-lta Mikroskooppi kielen kääntäjä on edellä häntäpää-jotta-häntäpää puhe käännös liuos optimismi ajaksi aito-elinikäinen keskustelu (vs. herkkäuskoinen ihmis-jotta koneistaa herruus) saatavana model after kauppa. Ennen tänään, puhe käännös ratkaisuja tarvitaan mukulakivisiä yhdessä useista eri API (puheen tunnistus, kääntäminen ja puhe synteesi), ei ole optimoitu puhe kielen puhetta tai suunniteltu toimi toistensa kanssa. Nyt loppu käyttäjät ja yritykset voivat poistaa kieli muurit ja integroida puheen käännöksen tutuissa sovelluksissa ja palveluissa.

 

Miten yritykseni voi käyttää puheen käännös teknologiaa?

Puheen käännöstä voidaan käyttää erilaisissa henkilötyö-, ryhmä-tai henkilö tieto kone skenaarioissa. Henkilöiden väliset skenaariot voivat sisältää yksisuuntainen käännös, kuten henkilökohtaisen käännöksen, tekstitys, tai kauko-tai henkilökohtaisesti monikielinen viestintä samanlainen kuin mitä tällä hetkellä löytyy Skype kääntäjä tai Microsoft Kääntäjä apps iOS ja Android. Ryhmä skenaariot voivat sisältää reaaliaikaisia esityksiä, kuten tapahtuma-avain muistiinpanoja, Webcast-lähetyksiä ja yliopisto luokkia tai tapaamisia, kuten henkilö kokouksia tai online-pelaamista chatrooms. Ihmisten väliset skenaariot voivat sisältää yritys tieto skenaarioita (kuten analyysin tai asiakas kutsujen lokit) tai tekoäly vuorovaikutusten.

Olemme juuri alkaneet tyhjästä pintaan skenaarioita, joissa tämä tekniikka auttaa, ja koska se on kone oppimisen perustuu, sen laatu ja siksi sovellettavuus paranee ajan myötä enemmän ihmisiä ja yritykset käyttävät sitä.

Useat kumppani yritykset ovat testanneet API:A ja integroituneen sen omiin sovelluksiinsa:

  • Tele viestintä 2 Ruotsissa, johtava matka puhelin operaattori yli 15 000 000 tilaajaa yli 15 maassa, integroitu Kääntäjä osaksi PBX tukea reaaliaikaisia puhe luita käännöksiä (ei App tarvita!) niiden matka Puhelin verkon.
  • Lionbridge (Boston, MA), kieli palvelun tarjoaja ja Gold Level Translator-kumppani kehittivät integroidun video tekstitys ratkaisun.
  • ProDeaf muut, sovellus myyjä erikoistunut kehittämään teknologiaa tuke maan huonokuuloisia ja kuuroja yhteisöjä, integroitu uusi API osaksi viittoma kielen avatar app jotta Monikielinen tuki puheen allekirjoittaa skenaarioita.

 

Miten puheen kääntäminen toimii?

Puhe puheeksi-käännös on hyvin monimutkainen haaste. Se käyttää uusinta AI teknologiaa, kuten syvä hermo verkot puheen tunnistuksen ja tekstin kääntäminen. Ei ole mitään muuta täysin integroitu puheen käännös ratkaisu saatavilla markkinoilla tänään ja tuottaa alustan, joka tukee tosielämän puheen käännös skenaarioita tarvitaan muutakin kuin vain ompelemalla yhteen nykyisen puheen tunnistuksen ja tekstin käännös tekniikat. Puheen käännöksessä on neljä vaihetta, jotka voivat antaa tämän kokemuksen:

  1. Automaattinen puheen tunnistus (ASR) — Syvä neuraalilaskennan verkko koulutettu tuhansia tunteja Audio analysoi saapuvan puhetta. Tämä malli on koulutettu ihmisen ja ihmisen välistä vuoro vaikutusta eikä ihmisen ja koneen komentoja, tuottaa puheen tunnistus, joka on optimoitu normaaliin keskusteluja.
  2. TosiTeksti Microsoft Research innovaatio, TrueText vie kirjaimellinen teksti ja muuntaa sen paremmin vastaamaan käyttäjän tarkoitusta. Se saavutetaan poistamalla puhe häiriö, kuten "Umm" s ja "Ah" s, sekä toistu sujuvasti ja toistoja. Teksti on myös tehty luettavampaa ja käännettäväksi lisäämällä lause taukoja, oikea väli merkit ja isojen kirjainten. (Katso kuva alla)
  3. Käännös Teksti käännetään mille tahansa Microsoft Translatorin tukeman 50 kielen kielelle. Kahdeksan puheen kieltä on edelleen optimoitu keskusteluja koulutuksen miljoonia sanoja puhe kielen tietoja käyttäen syvä hermo verkot powered kieli malleja.
  4. Teksti puheeksi — Jos kohde kieli on yksi tuetuista 18 puhe kielestä, teksti muunnetaan puhe tulosksi puhe synteesiä käyttäen. Tämä vaihe jätetään pois puheeksi tekstiksi-käännös skenaarioista, kuten videoiden tekstitystä.

Miten pääsen alkuun?

Uuden Microsoft Translator Speech API-liittymän aloittaminen on helppoa. Ilmainen 10 tunnin kokeilu versio on saatavilla osoitteessa aka.ms/TranslatorADMSpeech. Voit testata asennuksen ja toteutuksen virtuaalisessa ympäristössä sekä lukea API-dokumentaatiota uusista Swagger sivu. Voit myös etsiä esimerkiksi sovelluksia ja muita hyödyllisiä tietoja Github.

Tietenkin, jos sinulla on kysyttävää, kysymyksiä tai palautetta, olisimme mielellämme kuulla sen! Voit kertoa meille Palaute ja tuki foorumi.

Opi lisää