Testēšana translation kvalitāte: viesu blog
Anand Chakravarty ir SDET par mašīntulkošanas komanda par pēdējo 2,5 gadu laikā, ir bijis Microsoft 8 gadus, un bija pirmais produkts testētājs par MT komanda (un "joprojām jautri ar testēšanu MT:-)"). Šodienas viesu emuārs ir par testēšanas translation kvalitāti.
—————————————————————————————————————
Viens no pirmajiem punktiem, kas nāk prātā, kad runā par pārbaudi kvalitātes tulkošanas sistēmu, ir, kā jūs pasākums kvalitāti, vai ir precīza, precizitāte tulkojumu? Tulkošana starp cilvēku valodām, izmantojot datorus, ir lauks, kas ir gandrīz pusi gadsimta vecs. Šī teritorija ir pietiekami izaicinoša, ka pat labākās pašlaik pieejamās mašīntulkošanas sistēmas nav tik tuvu lingvistiskās kvalitātes iegūšanai, kas būtu pilnīgi apmierinošas.
Daļa no izaicinājums ir daudz dažādu datu punktu, kas cilvēkiem procesu, lai saprastu nozīmē mutvārdu/rakstveida tekstu. Ir sintakse, parsing, semantika, konteksts, jo, pārkārtošana, kas visi, un vairāk, iedziļināties izpratne teikumu. Un tas ir tikai teikums 1 valodā. Tagad uzskata, piemērojot visu to atjaunot teikumu citā valodā un dara to vienlīdz nozīmīgs.
Daži piemēri varētu palīdzēt padarīt šo jautājumu skaidrāku. Termins "Olimpiskās spēles 2008" ir samērā nepārprotama. Tāpat varētu sagaidīt, ka termins "vēlēšanas 2008" nozīmē ASV prezidenta vēlēšanas. Tomēr, ja lietotājs ir no, teiksim, Kanādā, tas, visticamāk, attiecas uz pašvaldību vēlēšanām tur.
Vispārīga, un līdz ar to biežāk, piemēram, teikums, piemēram, "Piezīme bija nepareizs". Vai vārds "Piezīme" ir atsauce uz informatīvu ziņojumu vai muzikālu terminu? Pareizais tulkojums ir atkarīgs no konteksta. Izmantot vairāk kontekstu, un jūsu izredzes iegūt precīzāku tulkojumu uzlabot. Tas tomēr nāk ar izmaksām: jo vairāk konteksta sistēma cenšas iegūt, lēnāk savu sniegumu. Gudri kuģniecības lēmumi ietver pareizo līdzsvaru starp tulkošanas precizitātes uzlabošanu un praktiski realizējamu tulkošanas rezultātu sniegšanu lietotājiem. Protams, abi ir svarīgi. Galvenais ir saprast, kur jūs tieši centieni uzlabot atkarībā no tā, cik noderīgs gala rezultāts ir lietotājam.
Tas kļūst īpaši interesants, tulkojot dokumentus vai tīmekļa lapas, nevis tikai atsevišķus teikumus. Ļaujiet mums teikt tulkojumu pieprasījums ir saņemta tīmekļa lapu, kas satur 100 teikumus. Atkarībā no arhitektūras tulkošanas sistēmas, šie teikumi visi varētu doties uz vienu procesu, vai sadalīt pa vairākiem procesiem/mašīnām. Katrā ziņā, ir skaidrs, ka laiks tulkot šo lapu kopumā ir proporcionāla maksimālajam laikam, lai tulkotu teikumu. Cik ilgi mēs tērējam teikuma tulkošanu pirms ieguldītais laiks kļūst neizdevīgs lietotāja laikā? Lai sasniegtu vislabāko tulkojumu, mēs varētu beigties bloķējot lietotājs kļūst kaut kas informatīvs, atbildot uz to tulkojumu pieprasījumu. Tādējādi sistēmas lietderību regulē lēmumi, kas ir pieņemti, lai līdzsvarotu lingvistisko kvalitāti un pieteikuma izpildi.
Izmantojot produktu Microsoft Translator, mūsu divvalodu skatītāja papildu iezīme ir tā, kas ir unikāls publiski pieejamo tulkošanas produktu vidū. Tas atbalsta paralēlo teksta iezīmēšanu, sinhronizētu ritināšanu un attēlo lapu (-as) ar pakāpenisku renderēšanu. Tas piebilst, vēl viens slānis, ko mūsu lietotājiem redzēt, un līdz ar to citu slāni, lai poļu un apdare.
Tā kā tuvāko nedēļu laikā, mēs ceram, lai sniegtu jums sīkāku informāciju par konkrētām jomām, kas bija un tiek testēti, lai kuģis augstas kvalitātes tulkošanas sistēmu. Jūtieties brīvi ievietot jebkādus jautājumus, jums ir par šo jautājumu, kaut ko jūs vienmēr gribēja jautāt:-), jo Komentāri sadaļā.