Passa a contenuti principali
Translator
Questa pagina è stata tradotta automaticamente dal servizio di traduzione automatica di Microsoft Translator. Ulteriori informazioni

Blog di Microsoft Translator

Le traduzioni di genere di Bing affrontano i pregiudizi nella traduzione

De-bias di genere
Rendering 3D di simboli di genere.

Siamo lieti di annunciare che, a partire da oggi, sono disponibili traduzioni alternative maschili e femminili per la traduzione dall'inglese allo spagnolo, al francese o all'italiano. Puoi provare questa nuova funzionalità in entrambi Ricerca Bing e Bing Translator Verticali.

Negli ultimi anni, il campo della traduzione automatica (MT) è stato rivoluzionato dall'avvento dei modelli di trasformatori, portando a enormi miglioramenti in termini di qualità. Tuttavia, i modelli ottimizzati per acquisire le proprietà statistiche dei dati raccolti dal mondo reale inavvertitamente apprendono o addirittura amplificano i pregiudizi sociali trovati in tali dati.

La nostra ultima versione è un passo avanti verso la riduzione di uno di questi pregiudizi, in particolare il pregiudizio di genere che è prevalente nei sistemi di traduzione automatica. Bing Translator ha sempre prodotto una singola traduzione per una frase di input anche quando le traduzioni avrebbero potuto avere altre variazioni di genere, incluse varianti femminili e maschili. In conformità con il Principi di intelligenza artificiale responsabile di Microsoft, vogliamo assicurarci di fornire traduzioni alternative corrette e di essere più inclusivi per tutti i generi. Come parte di questo viaggio, il nostro primo passo è fornire varianti di traduzione femminili e maschili.

Il genere è espresso in modo diverso tra le diverse lingue. Ad esempio, in inglese, la parola avvocato potrebbe riferirsi a un individuo maschio o femmina, ma in spagnolo, abogada si riferirebbe a un avvocato donna, mentre Abogado si riferirebbe a uno maschio. In assenza di informazioni sul genere di un nome come "avvocato" in una frase sorgente, i modelli MT possono ricorrere alla selezione di un genere arbitrario per il nome nella lingua di destinazione. Spesso, queste assegnazioni di genere arbitrarie si allineano con gli stereotipi, perpetuando pregiudizi sociali dannosi (Stanovsky et al., 2019; Ciora et al., 2021) e portando a traduzioni non del tutto accurate.

Nell'esempio seguente, si nota che durante la traduzione di frasi neutre dal genere allo spagnolo, il testo tradotto segue il ruolo di genere stereotipato, cioè l'avvocato è tradotto come maschile.

Traduzione con pregiudizi di genere
Screenshot della traduzione del testo inglese "Otteniamo l'opinione del nostro avvocato su questo problema." in lingua spagnola con pregiudizi di genere.

Poiché non vi è alcun contesto nella frase di origine che implichi il genere dell'avvocato, produrre una traduzione con il presupposto di un avvocato maschio o femmina sarebbe entrambi validi. Ora, Bing Translator produce traduzioni con forme sia femminili che maschili.

Traduzione di testo inglese ambiguo di genere in spagnolo
Screenshot della traduzione del testo inglese "Let's get our lawyer's opinion on this issue." in lingua spagnola con traduzioni specifiche per genere.

Progettazione del sistema

Abbiamo mirato a progettare il nostro sistema per soddisfare i seguenti criteri chiave per fornire alternative di genere:

  1. Le varianti femminile e maschile dovrebbero avere differenze minime ad eccezione di quelle necessarie per trasmettere il genere.
  2. Volevamo coprire una vasta gamma di frasi in cui sono possibili più alternative di genere.
  3. Volevamo assicurarci che le traduzioni preservassero il significato della frase originale.

Rilevare l'ambiguità di genere

Al fine di rilevare con precisione l'ambiguità di genere nel testo sorgente, utilizziamo un modello di coriferimento per analizzare gli input contenenti nomi animati. Ad esempio, se un determinato testo di input contiene una parola professionale neutra rispetto al genere, vogliamo fornire alternative di genere solo quando il suo genere non può essere determinato da altre informazioni nella frase. Ad esempio: traducendo una frase inglese "L'avvocato ha incontrato il suo autista nella hall dell'hotel." in francese possiamo determinare che l'avvocato è donna, mentre il sesso del conducente è sconosciuto.

Traduzione di testo inglese ambiguo di genere in francese
Screenshot della traduzione del testo inglese "L'avvocato ha incontrato il suo autista nella hall dell'hotel." in lingua francese.

Generazione di traduzioni alternative

Quando la frase di origine è ambiguamente di genere, esaminiamo l'output del nostro sistema di traduzione per decidere se è possibile un'interpretazione alternativa del genere. In tal caso, procediamo a determinare il modo migliore per rivedere la traduzione. Iniziamo costruendo una serie di traduzioni target candidate riscrivendo la traduzione originale. Applichiamo vincoli linguistici basati su relazioni di dipendenza per garantire coerenza nelle alternative proposte e potare i candidati errati.

Tuttavia, in molti casi, anche dopo aver applicato i nostri vincoli, ci rimangono più riscritture candidate per la traduzione alternativa di genere. Per determinare l'opzione migliore, valutiamo ogni candidato assegnando un punteggio con il nostro modello di traduzione. Sfruttando il fatto che una buona riscrittura di genere sarà anche una traduzione accurata della frase sorgente, siamo in grado di garantire un'elevata precisione nel nostro output finale.

Progettazione del sistema di reinflessione di genere
Un diagramma che mostra la progettazione del sistema di reinflessione di genere.

Utilizzo degli endpoint online gestiti in Azure Machine Learning

La funzionalità alternativa di genere in Bing è ospitata su Endpoint online gestiti in Azure Machine Learning. Gli endpoint online gestiti forniscono un'interfaccia unificata per richiamare e gestire le distribuzioni di modelli su risorse di calcolo gestite da Microsoft in modo chiavi in mano. Ci consentono di sfruttare endpoint scalabili e affidabili senza preoccuparci della gestione dell'infrastruttura. Questo ambiente di inferenza consente inoltre l'elaborazione di un numero elevato di richieste con bassa latenza. La nostra capacità di creare e distribuire il servizio di discriminazione di genere con i framework e le tecnologie più recenti è stata notevolmente migliorata grazie all'uso delle funzionalità di inferenza gestita in Azure Machine Learning. Sfruttando queste funzionalità, siamo stati in grado di mantenere bassi i COGS (Cost of Goods Sold) e garantire una semplice conformità alla sicurezza e alla privacy.

Come puoi contribuire?

Per facilitare i progressi nella riduzione dei pregiudizi di genere nella MT, stiamo rilasciando un corpus di test contenente esempi di traduzione ambigui di genere dall'inglese allo spagnolo, al francese e all'italiano. Ogni frase di origine inglese è accompagnata da più traduzioni, che coprono ogni possibile variazione di genere.

Il nostro set di test è costruito per essere impegnativo, morfologicamente ricco e linguisticamente diversificato. Questo corpus è stato determinante nel nostro processo di sviluppo. È stato sviluppato con l'aiuto di un linguista bilingue con una significativa esperienza di traduzione. Stiamo anche rilasciando un documento tecnico che discute il corpus di test in dettaglio e la metodologia e gli strumenti per la valutazione.

GATE: Una sfida per gli esempi di traduzione ambigui di genere – Carta

GATE: Un set di sfide per esempi di traduzione ambigui di genere – Set di test

Percorso da seguire

Attraverso questo lavoro miriamo a migliorare la qualità dell'output MT nei casi di genere di origine ambiguo, oltre a facilitare lo sviluppo di strumenti di elaborazione del linguaggio naturale (NLP) migliori e più inclusivi in generale. La nostra versione iniziale si concentra sulla traduzione dall'inglese allo spagnolo, al francese e all'italiano. In futuro, prevediamo di espanderci a nuove combinazioni linguistiche, oltre a coprire ulteriori scenari e tipi di pregiudizi.

Crediti:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.