Pular para o conteúdo principal
Tradutor

Blog do Microsoft Translator

As traduções de gênero do Bing abordam o preconceito na tradução

Eliminação de preconceitos de gênero
Renderização em 3D de símbolos de gênero.

Temos o prazer de anunciar que, a partir de hoje, as traduções alternativas masculinas e femininas estão disponíveis ao traduzir do inglês para o espanhol, francês ou italiano. Você pode experimentar esse novo recurso em Pesquisa do Bing e Tradutor do Bing verticais.

Nos últimos anos, o campo da tradução automática (MT) foi revolucionado pelo advento dos modelos de transformação, o que levou a enormes melhorias na qualidade. No entanto, os modelos otimizados para capturar as propriedades estatísticas dos dados coletados no mundo real aprendem inadvertidamente ou até mesmo amplificam as tendências sociais encontradas nesses dados.

Nosso último lançamento é um passo para reduzir um desses vieses, especificamente o viés de gênero que é predominante nos sistemas de MT. O Bing Translator sempre produziu uma única tradução para uma frase de entrada, mesmo quando as traduções poderiam ter tido outras variações de gênero, incluindo variantes femininas e masculinas. De acordo com o Princípios de IA responsável da MicrosoftCom o objetivo de garantir que forneçamos traduções alternativas corretas e que sejamos mais inclusivos para todos os gêneros. Como parte dessa jornada, nossa primeira etapa é fornecer variantes de tradução femininas e masculinas.

O gênero é expresso de forma diferente em diferentes idiomas. Por exemplo, em inglês, a palavra advogado pode se referir a um indivíduo do sexo masculino ou feminino, mas em espanhol, abogada se referiria a uma advogada, enquanto abogado se referiria a um homem. Na ausência de informações sobre o gênero de um substantivo como "advogado" em uma frase de origem, os modelos de MT podem recorrer à seleção de um gênero arbitrário para o substantivo no idioma de destino. Muitas vezes, essas atribuições arbitrárias de gênero se alinham com estereótipos, perpetuando preconceitos sociais prejudiciais (Stanovsky et al., 2019; Ciora et al., 2021) e levando a traduções que não são totalmente precisas.

No exemplo abaixo, você percebe que, ao traduzir frases de gênero neutro do inglês para o espanhol, o texto traduzido segue o papel estereotipado de gênero, ou seja, o advogado é traduzido como sendo do sexo masculino.

Tradução com viés de gênero
Captura de tela da tradução do texto em inglês "Let's get our lawyer's opinion on this issue." para o idioma espanhol com preconceito de gênero.

Como não há nenhum contexto na frase original que implique o gênero do advogado, a produção de uma tradução com a suposição de um advogado homem ou mulher seria válida. Agora, o Bing Translator produz traduções com formas femininas e masculinas.

Tradução de um texto ambíguo de gênero em inglês para o espanhol
Captura de tela da tradução do texto em inglês "Let's get our lawyer's opinion on this issue." para o idioma espanhol com traduções específicas de gênero.

Projeto do sistema

Nosso objetivo era projetar nosso sistema para atender aos seguintes critérios principais para oferecer alternativas de gênero:

  1. As variantes femininas e masculinas devem ter diferenças mínimas, exceto aquelas necessárias para transmitir o gênero.
  2. Queríamos abranger uma ampla gama de frases em que várias alternativas de gênero são possíveis.
  3. Queríamos garantir que as traduções preservassem o significado da frase original.

Detecção de ambiguidade de gênero

Para detectar com precisão a ambiguidade de gênero no texto de origem, utilizamos um modelo de coreferência para analisar entradas que contêm substantivos animados. Por exemplo, se um determinado texto de entrada contiver uma palavra profissional de gênero neutro, só queremos fornecer alternativas de gênero para ela quando seu gênero não puder ser determinado por outras informações na frase. Por exemplo: Ao traduzir uma frase em inglês "The lawyer met her driver at the hotel lobby." para o francês, podemos determinar que a advogada é mulher, enquanto o gênero do motorista é desconhecido.

Tradução de um texto ambíguo de gênero em inglês para o francês
Captura de tela da tradução do texto em inglês "The lawyer met her driver at the hotel lobby." para o francês.

Geração de tradução alternativa

Quando a frase original tem um gênero ambíguo, examinamos o resultado do nosso sistema de tradução para decidir se uma interpretação alternativa de gênero é possível. Em caso afirmativo, prosseguimos para determinar a melhor maneira de revisar a tradução. Começamos construindo um conjunto de traduções-alvo candidatas reescrevendo a tradução original. Aplicamos restrições linguísticas com base em relações de dependência para garantir a consistência das alternativas propostas e eliminar os candidatos errôneos.

No entanto, em muitos casos, mesmo depois de aplicar nossas restrições, ficamos com várias reescritas candidatas para a tradução alternativa com gênero. Para determinar a melhor opção, avaliamos cada candidato pontuando-o com nosso modelo de tradução. Aproveitando o fato de que uma boa reescrita de gênero também será uma tradução precisa da frase original, podemos garantir alta precisão em nosso resultado final.

Projeto do sistema de reinflexão de gênero
Um diagrama que mostra o design do sistema de reinflexão de gênero.

Aproveitamento de pontos de extremidade on-line gerenciados no aprendizado de máquina do Azure

O recurso alternativo de gênero no Bing está hospedado em endpoints on-line gerenciados no aprendizado de máquina do Azure. Os pontos de extremidade on-line gerenciados fornecem uma interface unificada para invocar e gerenciar implantações de modelos na computação gerenciada pela Microsoft de uma maneira pronta para uso. Eles nos permitem aproveitar os endpoints dimensionáveis e confiáveis sem nos preocuparmos com o gerenciamento da infraestrutura. Esse ambiente de inferência também permite o processamento de um grande número de solicitações com baixa latência. Nossa capacidade de criar e implantar o serviço de debias de gênero com as estruturas e tecnologias mais recentes foi bastante aprimorada com o uso de recursos de inferência gerenciada no Azure Machine Learning. Ao aproveitar esses recursos, conseguimos manter um baixo COGS (Custo de Mercadorias Vendidas) e garantir a conformidade direta com a segurança e a privacidade.

Como você pode contribuir?

Para facilitar o progresso na redução de preconceitos de gênero na MT, estamos lançando um corpus de teste com exemplos de traduções ambíguas de gênero do inglês para o espanhol, francês e italiano. Cada frase de origem em inglês é acompanhada de várias traduções, abrangendo cada variação de gênero possível.

Nosso conjunto de testes foi construído para ser desafiador, morfologicamente rico e linguisticamente diverso. Esse corpus foi fundamental em nosso processo de desenvolvimento. Ele foi desenvolvido com a ajuda de um linguista bilíngue com experiência significativa em tradução. Também estamos lançando um artigo técnico que discute o corpus de teste em detalhes e a metodologia e as ferramentas de avaliação.

GATE: um desafio para exemplos de tradução ambígua de gênero - Paper

GATE: um conjunto de desafios para exemplos de tradução ambígua de gênero - conjunto de testes

Caminho a seguir

Com esse trabalho, pretendemos melhorar a qualidade do resultado da MT em casos de gênero de origem ambíguo, bem como facilitar o desenvolvimento de ferramentas de processamento de linguagem natural (NLP) melhores e mais inclusivas em geral. Nossa versão inicial se concentra na tradução do inglês para o espanhol, francês e italiano. No futuro, planejamos expandir para novos pares de idiomas, bem como abranger outros cenários e tipos de preconceitos.

Créditos:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.