Sebuah logam dapat (tidak bisa?): Guest blog
Lee Schwartz adalah seorang linguis komputasi pada tim Microsoft Translator. Tamu hari ini blog adalah tentang tersesat di (mesin) terjemahan...
———————————————————————————–
Baru-baru ini, seorang pengguna tampak kesal dengan terjemahan yang dia terima untuk cat logam dapat. Tidak heran. Ketika ia menerjemahkan ini ke dalam bahasa Spanyol, ia mendapat un logam pintura Puede, yang berarti cat logam mampu. Dan, apa yang seharusnya berarti? Tapi, sekali lagi, apa yang "berarti" untuk sistem terjemahan mesin sih? Apakah ada yang berarti apa-apa? Atau, apakah komputer hanya melihat kata dalam kombinasi dalam satu bahasa dan kata yang sesuai dalam bahasa lain? Dan apakah itu mengasumsikan bahwa karena satu urutan yang digunakan dalam bahasa sumber ketika lain digunakan dalam target, satu adalah terjemahan lain? Bahkan jika terjemahan mesin program ini hanya melihat kata dalam kombinasi, Bukankah akan terlihat cat dapat sebelum dan mengetahui bahwa Dapat dalam konteks ini adalah semacam kontainer? Kemudian, sekali lagi, Anda dapat yakin bahwa komputer di belakang program MT tahu apa-apa tentang kaleng cat, atau telah melihat dua kata dalam kombinasi? Mengapa Anda pikir itu akan? Tapi, memberikan manfaat dari keraguan, dan dengan asumsi itu tahu semua tentang kaleng cat, atau setidaknya telah melihat string cat dapat banyak, bagaimana seharusnya tahu bagaimana menerjemahkan cat logam dapat? Mungkin komputer telah melihat sesuatu seperti Film logam di satu sisi piring... dapat diperoleh dengan... Penyemprotan cat logam atau....
Ah ha! Jadi sebenarnya ada cat logam. Dan, jika ada cat logam, mengapa tidak bisa cat logam dapat menjadi jawaban untuk cat logam bisa, tidak bisa? Yah, itu hanya tidak mungkin bahwa ketika Anda memiliki kata Cat Dan Dapat secara berurutan, bahwa Dapat Berarti dapat. Tapi sekali lagi itu hanya tidak mungkin bahwa Dapat berarti apa-apa kecuali dapat. Saya kira kita bisa mengatakan hal dan berpikir hal yang hanya tidak mungkin. Saya dapat dengan mudah memahami apa yang Cat logam dapat, tidak bisa itu? Berarti. Komputer mungkin hanya berpikir bahwa saya secara tidak sengaja mengetik Dapat Dua kali. Tentu saja, jika belajar dari data nyata, katakanlah dari web, ia akan melihat dapat Banyak. Mungkin itu sebabnya tidak akan menerjemahkan Dia melakukan yang dapat Benar. Tapi sungguh, apa yang dilakukan bahasa Inggris dengan begitu banyak jenis Kaleng Anyway? Kita bahkan bisa cacing, tapi kita tidak akan membuka yang satu sekarang.