Gruppo di traduzione automatica presso Microsoft Research
Il gruppo di traduzione automatica di Microsoft Research (MSR-MT) è stato tra le principali organizzazioni di ricerca nello spazio di traduzione automatica per oltre 8 anni, e alcuni dei lavori fondamentali nell'elaborazione del linguaggio naturale presso MSR sono iniziati oltre 16 anni fa. L'approccio del team alla traduzione automatica integra funzionalità linguistiche con algoritmi statistici di traduzione automatica all'avanguardia. L'attenzione del team è sempre stata l'acquisizione automatica di conoscenze di traduzione da corpora bilingue, cioè dati paralleli costituiti da frasi di lingua originale e le loro traduzioni corrispondenti da traduttori umani. Circa 3 anni fa, l'attenzione del team si è spostata da un approccio puramente basato su regole a questo compito verso un approccio ibrido che include un'estesa elaborazione statistica, consentendo una maggiore scalabilità tra domini e in nuovi linguaggi.
La tecnologia di traduzione automatica di Microsoft è stata sviluppata per la prima volta per scopi di localizzazione in-House, per Consentire la nostra organizzazione di assistenza clienti per pubblicare documenti di supporto tecnico con una frequenza e ampiezza di lingua che sarebbe stato proibitivo costoso utilizzando traduttori umani. Con tutti i documenti di Microsoft precedentemente tradotti e il software localizzato a sua disposizione, il team MT è stato in grado di addestrare automaticamente il suo motore statistico MT per ottenere una qualità abbastanza buona nel settore tecnico. Questa tecnologia è stata estesa per supportare il team di localizzazione di Windows, la divisione Developer, MSDN e diversi altri gruppi all'interno di Microsoft. Ha anche permesso a Microsoft di raggiungere molti più clienti di quanto sarebbe mai stato possibile utilizzando la traduzione umana da solo.
Dopo aver concentrato le proprie esigenze di traduzione di Microsoft, il team ha iniziato a costruire un servizio Web scalabile che gli consentirebbe di fornire servizi di traduzione al pubblico in generale, come strumento autonomo sul Web e come funzionalità all'interno di altri prodotti. Dato che il motore di Microsoft MT è stato addestrato più pesantemente sui dati tecnici, non è ancora stato ottimizzato per tradurre il testo in altri domini soggetto. Tuttavia, speriamo di continuare a migliorare la qualità e l'ampiezza del motore. Non vediamo l'ora di condividere i nostri sviluppi con voi nei prossimi mesi su questo blog.
– L'Erica