Siirry päähistoria
Kääntäjä
Microsoft Translatorin kone käännös palvelu on kääntänyt tämän sivun automaattisesti. Opi lisää

Microsoft Kääntäjä blogi

Poliittisesti väärät koneet

Vaikka me Machine käännös tiimi on nähdä yhä enemmän liikennettä meidän eri tarjonta ansa viime kuukausina, huomasimme äkillinen kolahtaa liikenteessä eilen. Ottaa kasvanut Agatha Christie ja Sherlock Holmes, kuten salaisuudet ovat vastustamattomia minulle-ja useita muita ihmisiä joukkue oli yhtä utelias selvittää, mikä aiheutti tämän äkillisen kolahtaa. Arvelimme, että IE8 aktiivisuus/AcceleratorNniiden Messenger bot-robotti, Hae käännöksiä, Office-käännökset olivat kaikki osoittavat samaa ylöspäin suuntaus kuin päivää ennen ja näin ollen ei ollut erityinen syy tähän kolahtaa.

Lopulta pystyimme tunnistamaan yksi mahdollinen syy, miksi olimme nähdä tämän piikki. Käyttäjä yhteisömme löysi omituisuuden siitä, miten kone käännös moottori jalostettu käännös useita nimiä Englanti ja Saksa. Oli odotettavissa, että kun moottori kääntää nimi ehdokkaan yhden osapuolen jonkun toisen osapuolen, kun otetaan huomioon nykyinen poliittinen ilma piiri ajaa jopa Yhdysvaltain vaalit, että se päätyy uutinen. Vaikka olemme varmasti tervetulleita kaikki uudet käyttäjät, jotka tulivat tarkistaa tämän ilmiön pois-halusimme jakaa käyttäjien kanssa syy, miksi tällaiset asiat näyttävät tapahtuvan ajoittain tilastollisesti koulutettu kone käännös järjestelmien meiltä ja muilta.

Tilastollinen kone käännös moottori on koulutettu paljon ja paljon rinnakkaisia tietoja, eli tiedot, jotka ovat olemassa sekä lähde kieli (esim. Englanti) ja kohde kieli (esim. Saksa), jossa lähde ja kohde ovat käännöksiä toisistaan. Meidän moottori on koulutettu miljoonia lauseita kunkin kieli parin tuemme. Voidakseen harjoitella erityisesti Corpus tietojen-ehkä suuri määrä Newswire artikkeleita Englanti, jotka on käännetty saksaksi-meidän on ensin rikkoa, että Corpus alas lauseita. Kun Corpus on lause rikki, me rehu tuloksena lauseita lause Aligner, jonka ainoana tarkoituksena on selvittää, mitä lauseita lähde puolella yhdenmukaistaa lauseita kohde puolella. Tämä ei ole vähäpätöinen tehtävä, koska lause toisella puolella voisi mahdollisesti yhdenmukaistaa yhden tai useamman lauseen tavoite (tai mahdollisesti ei ollenkaan!). Aligner joskus tehdä virheitä, ja väärin yksi lause toiseen, joka ei itse asiassa ole käännös. Tämä voi johtaa joihinkin virheellisiin käännöksiin, varsinkin jos lähteessä ja tavoitteissa on sanoja, joita esiintyy harvoin. Koska käännös moottorimme on tilastollinen, se on erittäin riippuvainen lähde-ja kohde tietojen sanojen välisestä yhteisesiintyvyyksestä. Jos tietyt sanat ovat harvoin esiintyy-ihmisten nimiä, esimerkiksi, voi tapahtua vain muutaman kerran koko Corpus miljoonia lauseita-puute taajuus voi johtaa väärien käännösten johtuvat virheellisistä "arvaa" välillä lähde ja tavoite (eli alhainen tiettyihin lähde-ja kohde sanoihin määritetyt todennäköisyydet). Tämä voi johtaa joihinkin koomisia gaffes meidän käännös järjestelmä.

Niin, että on, miten "kone" päätti kääntää siten, että päätyi yhteisön liittämällä sen huumorin taju tiimimme. Vaikka jatkamme kovasti töitä varmistaakseen asianmukaisen linjausten, se on odotettavissa tilastollinen järjestelmä, joka on rakennettu miljoonia miljardeja sanoja, että tällainen tilanne voisi toistaa.

Ajankohtainen antaa avulla Alignment pitäisi kas noin olla hajota ainoastaan me vietti meidän yhdyskunta-lta käyttäjä jotta elatus auttaa objekti muoto hahmottaa jokin moinen asema luona asettua yhteyteen objekti muoto alusta loppuun nyt kuluva blog.

-Vikram

Vikram dendi johtaa liiketoiminta strategiaa & Microsoft Translator-tiimin tuote suunnittelua