Testare la qualità della traduzione: Guest Blog
Anand Chakravarty è un SDET sul team di traduzione automatica per gli ultimi 2,5 anni, è stato in Microsoft per 8 anni, ed è stato il primo tester di prodotto sul team MT (e "ancora divertirsi con test MT:-)"). Il Blog degli ospiti di oggi è di testare la qualità della traduzione.
—————————————————————————————————————
Uno dei primi punti che viene in mente, quando si parla di verificare la qualità di un sistema di traduzione, è come si misura la qualità, o per essere precisi, l'accuratezza della traduzione? Tradurre tra le lingue umane utilizzando i computer è un campo che è quasi mezzo secolo vecchio. La zona è abbastanza impegnativa che anche i migliori sistemi di traduzione automatica attualmente disponibili non sono vicini all'ottenimento di qualità linguistica che sarebbe del tutto soddisfacente.
Parte della sfida sono i molti punti di dati diversi che gli esseri umani elaborano per comprendere il significato del testo parlato/scritto. C'è la sintassi, l'analisi, la semantica, il contesto, il disambigua, il riordino, tutti i quali, e altro ancora, entrano nella comprensione di una frase. E questa è solo la frase in 1 lingua. Ora considerare l'applicazione di tutto per ricostruire la frase in un'altra lingua e renderlo altrettanto significativo.
Alcuni esempi potrebbero contribuire a rendere questo punto più chiaro. Il termine ' Olimpiadi 2008' è abbastanza univoco. Analogamente, ci si potrebbe aspettare che il termine "elezioni 2008" significhi le elezioni presidenziali negli Stati Uniti. Tuttavia, se l'utente è da, diciamo, Canada, sarebbe più probabile fare riferimento alle elezioni locali lì.
Un esempio più generale, e quindi più comune, è una frase come "la nota era sbagliata". La parola ' nota ' è un riferimento a un messaggio informativo o a un termine musicale? La traduzione corretta dipende dal contesto. USA più contesto e le tue possibilità di ottenere una traduzione più accurata migliorano. Questo però ha un costo: più contesto il sistema cerca di ottenere, più lento è il suo rendimento. Le decisioni di spedizione intelligenti implicano il giusto equilibrio tra migliorare l'accuratezza della traduzione e fornire un risultato di traduzione praticabile agli utenti. Naturalmente, entrambi sono importanti. La chiave è capire dove si dirigono gli sforzi di miglioramento a seconda di quanto utile il risultato finale è per l'utente.
Questo diventa particolarmente interessante quando si traducono documenti o pagine Web, invece di semplici frasi individuali. Diciamo che una richiesta di traduzione è stata ricevuta per una pagina Web contenente 100 frasi. A seconda dell'architettura del sistema di traduzione, queste frasi potrebbero passare a un processo o essere distribuite su più processi/macchine. In entrambi i casi, è chiaro che il tempo preso per tradurre questa pagina nella sua interezza è proporzionale al tempo massimo per tradurre una frase. Quanto tempo passiamo a tradurre una frase prima che il tempo investito diventi dannoso per il tempo dell'utente? Nel perseguimento della migliore traduzione, potremmo finire per bloccare l'utente di ottenere qualcosa di informativo in risposta alla loro richiesta di traduzione. L'utilità del sistema è quindi regolata da decisioni che sono fatte per bilanciare la qualità linguistica e le prestazioni delle applicazioni.
Con il prodotto Microsoft Translator, c'è la funzionalità aggiuntiva del nostro Visualizzatore bilingue, qualcosa di unico tra i prodotti di traduzione pubblicamente disponibili. Supporta l'evidenziazione del testo parallelo, lo scorrimento sincronizzato e presenta le pagine con rendering progressivo. Questo aggiunge un altro livello a ciò che i nostri utenti vedono, e di conseguenza un altro strato per lucidare e finire.
Nelle prossime settimane, speriamo di portarvi maggiori dettagli su aree specifiche che sono state e vengono testate per spedire un sistema di traduzione di alta qualità. Sentiti libero di pubblicare tutte le domande che hai su questo argomento, qualcosa che hai sempre voluto chiedere:-), nella sezione commenti.