Maskin oversættelses gruppe hos Microsoft Research
Microsoft Research 's maskin oversættelses gruppe (MSR-MT) har været blandt de førende forskningsorganisationer i maskin oversættelses rummet i over 8 år, og noget af det grundlæggende arbejde inden for behandling af naturligt sprog i MSR begyndte for over 16 år siden. Holdets tilgang til maskinoversættelse integrerer sproglige funktioner med de nyeste statistiske maskin oversættelses algoritmer. Holdets fokus har altid været på automatisk at erhverve oversættelses viden fra tosprogede corpora, dvs parallelle data, der består af originale kildesprog sætninger og deres tilsvarende oversættelser af menneskelige oversættere. For ca. 3 år siden skiftede holdets fokus fra en rent regel baseret tilgang til denne opgave mod en hybrid tilgang, der omfatter omfattende statistisk behandling, hvilket giver mulighed for større skalerbarhed på tværs af domæner og til nye sprog.
Microsofts maskin oversættelsesteknologi blev først udviklet med henblik på interne lokaliserings formål, Tillade vores kundesupport organisation til at udgive teknisk supportdokumenter med en frekvens og sprog bredde, der ville have været uoverkommeligt dyrt ved hjælp af menneskelige oversættere. Med alle Microsofts tidligere menneske-oversatte dokumenter og lokaliseret software til rådighed, MT holdet var i stand til automatisk at uddanne sin statistiske MT motor for at opnå ganske god kvalitet i det tekniske domæne. Denne teknologi blev udvidet til at understøtte Windows-lokaliserings teamet, Developer division, MSDN og flere andre grupper i Microsoft. Det har også givet Microsoft mulighed for at nå ud til mange flere kunder, end det nogensinde ville have været muligt at bruge menneskelig oversættelse alene.
Efter at have fokuseret på Microsofts egne oversættelsesbehov begyndte teamet at opbygge en skalerbar webtjeneste, som ville gøre det muligt for den at levere oversættelsestjenester til offentligheden som en selvstændigt værktøj på nettet, og som en funktion i andre produkter. Da Microsoft MT-motoren er blevet uddannet mest på tekniske data, er den endnu ikke indstillet til oversættelse af tekst i andre emne domæner. Men vi håber at fortsætte med at forbedre kvaliteten og bredden af motoren. Vi ser frem til at dele vores udvikling med dig i løbet af de kommende måneder på denne blog.
– Lyng