Vrijeme Jeli na glavniju
Prevoditelj
Ova stranica automatski je prevedena pomoću servisa za strojno prevođenje tvrtke Microsoft Translator. Saznajte više

Blog Microsoft prevoditelj

Testiranje kvalitete prevođenja: Gost blog

Anand Chakravarty je SDET na mašini za strojno prevođenje u proteklih 2,5 godina, bio je u Microsoftu 8 godina, i bio je prvi tester proizvoda na MT timu (i "još uvijek se zabavlja s ispitivanjem MT:-)").  Današnji gost blog je o testiranju kvalitete prevođenja. 

—————————————————————————————————————

Jedna od prvih točaka koja mi pada na pamet, kada govorimo o potvrđivanju kvalitete prevoditeljskog sustava, je kako izmjerite kvalitetu, ili da budemo precizni, točnost prijevoda? Prevođenje između ljudskih jezika pomoću računala je polje koje je gotovo pola stoljeća staro. Područje je dovoljno izazovno da čak i najbolji trenutno dostupni strojni prevoditeljski sustavi nisu blizu dobivanja jezične kvalitete koja bi bila potpuno zadovoljavajuća.

Dio izazova je mnogo različitih podatkovnih točaka koje ljudi obrađuju kako bi razumjeli značenje govornog/pisanog teksta. Tu je sintaksa, parsing, semantika, kontekst, razdvojba, prenaručivanje, a sve to, i još mnogo toga, ide u razumijevanje rečenice. A ovo je samo rečenica na 1 jeziku. Sada razmotrite primijeniti sve to kako biste ponovno izgradili rečenicu na drugom jeziku i učinili ga jednako smislenim.

Neki primjeri mogu pomoći da ova točka bude jasnije. Pojam "Olimpijske igre 2008" prilično je nedvosmislen. Slično tome, može se očekivati da pojam "izbori 2008" znače predsjedničke izbore u SAD-u. Međutim, ako je korisnik iz, recimo, Kanade, vjerojatnije bi se odnosili na lokalne izbore.

Više općenito, a time i češće, primjer je rečenica kao "bilješka je bila pogrešna". Je li riječ "bilješka" referenca na informativnu poruku ili glazbeni termin? Pravilan prijevod ovisi o kontekstu. Koristite više konteksta i vaše šanse za poboljšanje preciznijeg prevođenja. To ipak dolazi po trošku: što više konteksta sustav pokušava dobiti, sporije njegova izvedba. Pametne odluke o isporuci uključuju postizanje prave ravnoteže između poboljšanja točnosti prijevoda i pružanja korisnih rezultata prijevoda korisnicima. Naravno, oboje su važni. Ključ je razumjeti gdje izravno nastojite poboljšati ovisno o tome koliko je koristan krajnji rezultat za korisnika.

To postaje posebno zanimljivo prilikom prijevoda dokumenata ili web-stranica, umjesto samo pojedinačnih rečenica. Recimo da je zahtjev za prijevodom primljen na web-stranicu koja sadrži 100 rečenica. Ovisno o arhitekturi sustava prevođenja, te rečenice mogu ići na jedan proces ili se distribuirati na više procesa/strojeva. U svakom slučaju, jasno je da je vrijeme potrebno za prevođenje ove stranice u cijelosti proporcionalno najvećem vremenu koje je potrebno za prevođenje rečenice. Koliko dugo provodimo prevođenje rečenice prije nego što uloženo vrijeme postane štetno za vrijeme korisnika? U potrazi za najboljim prijevodom, možda ćemo završiti blokiranje korisnika od dobivanja ništa informativno kao odgovor na njihov zahtjev za prevođenje. Korisnost sustava stoga je uređena odlukama koje su donesene u ravnoteži jezične kvalitete i uspješnosti primjene.

Uz Microsoft Translator proizvod, tu je dodatna značajka našeg dvojezičnog gledatelja, nešto jedinstveno među javno dostupnim prevoditeljskim proizvodima. Podržava paralelno isticanje teksta, Sinkronizirano pomicanje i predstavlja stranicu (e) s progresivnim renderiranjem. To dodaje još jedan sloj onome što naši korisnici vide, a time i drugi sloj za poliranje i završetak.

U nadolazeći tjedni nadamo se da ćemo vam donijeti više detalja o specifičnim područjima koja su bila i testiraju se za otpremu vrhunskog prevoditeljskog sustava. Slobodno objavite sva pitanja koja imate o ovom pitanju, nešto što ste uvijek željeli pitati:-), u odjeljku Komentari.