Microsoft Translator julkaisee julkisesti puheen käännös Corpus
Christian Federmann, vanhempi ohjelma päällikkö |
Osana jatkuvaa pyrkimystä parantaa tarkkuutta tekoäly (AI) järjestelmien, Microsoft Kääntäjä julkaisee julkisesti joukko tietoja, jotka sisältävät useita keskusteluja kaksikielisiä puhujia, jotka puhuvat ranskaa, Saksaksi ja englanniksi.
Tämä Corpus, joka on tuotettu Microsoftin kaksikielisiä kaiuttimia, tavoitteena on luoda standardi, jonka avulla ihmiset voivat mitata, miten hyvin niiden puhe kielen puheen käännös järjestelmät toimivat. Se voi olla standardoitu tieto joukko testattavaksi kaksikielisiä puhe kielen puheen käännös järjestelmiä, kuten Mikroskooppi kielen kääntäjä suorana lähetyksenä erikoisartikkeli Ja Skypen Kääntäjä.
Christian Federmann, vanhempi ohjelma päällikkö työskentelee Microsoft Kääntäjä joukkue, sanoi, että ei ole niin paljon standardoituja tieto kokonaisuuteen testaus kaksikielinen puhe kielen puheen käännös järjestelmiä. "Tarvitset laadukkaita tietoja, jotta laadukkaita testaus", Federmann sanoi.
Microsoft tiimi toivoo Corpus, joka on vapaasti saatavilla, hyödyttää koko alan puhe kielen käännös ja auttaa luomaan enemmän standardoituja vertailu arvoja, että tutkijat voivat käyttää mitata työtään toisia vastaan.
"Tämä auttaa kuljettamaan kentän eteenpäin", sanoi Will Lewis, pääasiallinen tekninen ohjelma päällikkö kanssa Microsoft Kääntäjä tiimi, joka myös työskennellyt hankkeessa.
Lataa Microsoft Speech Language Translation Corpus Täällä.
Lisä tietoja tästä julkaisusta sekä muita tapoja, joilla Microsoft tekee tekoäly älykkäämpiä ja tarkempia Microsoft Research blogi.
Opi lisää