Pular para o conteúdo principal
Tradutor

Blog do Microsoft Translator

Grupo de tradução automática na Microsoft Research

O grupo de tradução automática da Microsoft Research (MSR-MT) está entre as principais organizações de pesquisa na área de tradução automática há mais de 8 anos, e alguns dos trabalhos fundamentais em processamento de linguagem natural na MSR começaram há mais de 16 anos. A abordagem da equipe à tradução automática integra recursos linguísticos com algoritmos de tradução automática estatística de última geração. O foco da equipe sempre foi a aquisição automática de conhecimento de tradução a partir de corpora bilíngues, ou seja, dados paralelos que consistem em frases originais do idioma de origem e suas traduções correspondentes feitas por tradutores humanos. Há cerca de três anos, o foco da equipe deixou de ser uma abordagem puramente baseada em regras para essa tarefa e passou a ser uma abordagem híbrida que inclui um extenso processamento estatístico, permitindo maior escalabilidade entre domínios e em novos idiomas.

A tecnologia de tradução automática da Microsoft foi desenvolvida inicialmente para fins de localização interna, para permitir nossa organização de Suporte ao Cliente para publicar documentos de suporte técnico com uma frequência e amplitude de idiomas que teria sido proibitivamente cara usando tradutores humanos. Com todos os documentos previamente traduzidos por humanos e softwares localizados da Microsoft à sua disposição, a equipe de MT conseguiu treinar automaticamente seu mecanismo de MT estatística para obter uma qualidade bastante boa no domínio técnico. Essa tecnologia foi ampliada para dar suporte à equipe de localização do Windows, à Divisão de Desenvolvedores, ao MSDN e a vários outros grupos da Microsoft. Ela também permitiu que a Microsoft alcançasse muito mais clientes do que seria possível usando apenas a tradução humana.

Depois de se concentrar nas necessidades de tradução da própria Microsoft, a equipe começou a criar um serviço da Web escalável que permitiria fornecer serviços de tradução ao público em geral, como um ferramenta autônoma na Web e como um recurso em outros produtos. Como o mecanismo de MT da Microsoft foi treinado principalmente em dados técnicos, ele ainda não foi ajustado para traduzir textos em outros domínios de assuntos. No entanto, esperamos continuar melhorando a qualidade e a abrangência do mecanismo. Esperamos compartilhar nossos desenvolvimentos com você nos próximos meses neste blog.

- Heather

Heather Thorne é diretora de estratégia comercial do grupo de tradução automática da Microsoft Research