Machine translation groep bij Microsoft Research
Microsoft Research machine translation (MSR-MT) groep is een van de toonaangevende onderzoeksorganisaties in de machine translation ruimte voor meer dan 8 jaar, en een aantal van de fundamentele werk in natuurlijke taalverwerking bij MSR begon meer dan 16 jaar geleden. Het team van de aanpak van machine translation integreert taalkundige kenmerken met state-of-the-art statistische machine vertaling algoritmen. De focus van het team is altijd geweest op het automatisch verwerven van Vertaal kennis van tweetalige corpora, d.w.z. parallelle gegevens bestaande uit originele brontaal zinnen en de bijbehorende vertalingen door menselijke vertalers. Ongeveer 3 jaar geleden, de focus van het team verschoven van een puur op regels gebaseerde benadering van deze taak in de richting van een hybride aanpak die uitgebreide statistische verwerking omvat, waardoor een grotere schaalbaarheid tussen domeinen en in nieuwe talen.
Microsoft's machine translation-technologie werd voor het eerst ontwikkeld voor in-House lokalisatie doeleinden, om Toestaan onze klantenservice organisatie om documenten te publiceren technische ondersteuning met een frequentie en taal breedte die zou zijn onbetaalbaar met behulp van menselijke vertalers. Met alle eerder door de mens vertaalde documenten van Microsoft en gelokaliseerde software tot haar beschikking, de MT-team was in staat om automatisch de opleiding van de statistische MT-motor te bereiken heel goede kwaliteit in het technische domein. Deze technologie werd uitgebreid ter ondersteuning van het Windows localization team, de Developer Division, MSDN en diverse andere groepen binnen Microsoft. Het heeft ook Microsoft toegestaan om veel meer klanten te bereiken dan ooit mogelijk zou zijn geweest met behulp van menselijke vertaling alleen.
Na het focussen op de eigen vertaling van Microsoft behoeften, het team begon een schaalbare webservice die het mogelijk maken om vertaaldiensten te leveren aan het grote publiek te bouwen, als een Standalone tool op het web, en als een functie binnen andere producten. Aangezien de Microsoft MT engine het zwaarst is opgeleid op technische gegevens, is het nog niet afgestemd op het vertalen van tekst in andere domeinen. Maar we hopen verder te blijven verbeteren van de kwaliteit en de breedte van de motor. We kijken uit naar het delen van onze ontwikkelingen met u de komende maanden op deze blog.
-Heather