Overslaan naar hoofdinhoud
Translator
Deze pagina is automatisch vertaald door de machine vertaalservice van Microsoft Translator. Meer informatie

Microsoft Translator Blog

Azure AI Custom Translator Neural Dictionary: Hogere terminologievertaalkwaliteit leveren 

Vandaag zijn we super verheugd om de release van neural dictionary aan te kondigen, een aanzienlijke verbetering van de vertaalkwaliteit van ons platform. In deze blogpost zullen we de neurale woordenboekfunctie verkennen.

Introductie  

Neuraal woordenboek is een uitbreiding op onze Dynamisch woordenboek En Zin woordenboek functies in Azure AI Translator. Beide stellen onze gebruikers in staat om de vertaaluitvoer aan te passen door hun eigen vertalingen voor specifieke termen of zinnen aan te bieden. Onze vorige methode gebruikte een letterlijk woordenboek, wat een exacte zoek-en-vervang-bewerking was. Neural dictionary verbetert de vertaalkwaliteit voor zinnen die een of meer termvertalingen kunnen bevatten door het machinevertalingsmodel zowel de term als de context te laten aanpassen om een vloeiendere vertaling te produceren. Tegelijkertijd blijft de hoge vertaalnauwkeurigheid behouden.  

Het volgende Engels-Duitse voorbeeld toont verschillen in vertaaluitvoer tussen beide methoden wanneer een aangepaste terminologievertaling wordt aangevraagd: 

Invoer:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Woordelijk woordenboek:   Grundkenntnisse der regelmäßigEs TestNl 
Neuraal woordenboek:   Grundkenntnisse DES regelmäßigNl TestEns 

Kwaliteitsverbetering 

De onderstaande grafiek illustreert de aanzienlijke verbeteringen die de nieuwe functie met zich meebrengt voor veelgebruikte openbaar beschikbare terminologietestsets in de auto-industrie (https://aclanthology.org/2021.eacl-main.271), Gezondheid (https://aclanthology.org/2021.emnlp-main.477) en COVID-19-domeinen (https://aclanthology.org/2021.wmt-1.69) met behulp van onze algemene vertaalmodellen. 

We hebben ook een reeks klantevaluaties uitgevoerd op het Custom Translator-platform en neurale woordenboekmodellen. We hebben de kwaliteitswinst van de vertaling op klantgegevens gemeten tussen modellen met en zonder de neurale woordenboekextensie. Vijf klanten namen deel, die Duits, Spaans en Frans bestreken in verschillende zakelijke domeinen.

Onderstaande grafiek toont de gemiddelde verbetering van KOMEET in het onderwijsdomein voor Engels-Duits, Engels-Spaans en Engels-Frans; voor algemene modellen aan de linkerkant, en voor aangepaste modellen aan de rechterkant. BLAUWE kleurbalken vertegenwoordigen de algemene vertaalkwaliteit zonder neuraal woordenboek en ORANJE kleurbalken vertegenwoordigen de vertaalkwaliteit met behulp van een neuraal woordenboek. Dit zijn over het algemeen gemiddelde verbeteringen op de gehele testsets. Voor segmenten met een of meer woordenboekvermeldingen van klanten (tussen 19% en 63%) is de verbetering zo hoog als +6,3 tot +12,9 COMET-punten. 

 Ondersteunde talen  

  • Momenteel beschikbaar (vanaf 6 december 2023): vereenvoudigd Chinees, Frans, Duits, Italiaans, Japans, Koreaans, Pools, Russisch, Spaans en Zweeds – van en naar het Engels.  
  • In de toekomst voegen we er nog meer toe. Voor updates, zie Opmerkingen bij de release van Custom Translator 

Hoe neuraal woordenboek werkt 

Neural Dictionary maakt geen gebruik van de exacte zoek-en-vervang-bewerking bij het verwerken van aangepaste terminologievertaling. In plaats daarvan vertaalt het termen of zinsdelen uit het woordenboek op een manier die het beste past bij de hele context. Dit betekent dat de term kan worden verbogen of een ander hoofdlettergebruik kan hebben, of dat de omringende woorden kunnen worden aangepast, waardoor een vloeiendere en coherentere vertaling ontstaat.  

Laten we bijvoorbeeld zeggen dat we de volgende invoerzin in het Engels hebben en dat de vertaling ervan in het Pools zonder woordenboekzinnen als volgt is:  

Invoer:   We hebben een snelle oplossing nodig die begrijpelijk is.  
Standaard vertaling:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Als u er zeker van wilt zijn dat "oplossing" wordt vertaald als "alternatywa" ("een alternatief" in het Engels), kunt u een dynamische woordenboekannotatie toevoegen om dat te bereiken:  

Invoer:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Woordelijk woordenboek:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Neuraal woordenboek:   Potrzebujemy szybkiej AlternatieWy, którA będzie zrozumiałA.  

De output die door de vorige methode wordt geproduceerd, is niet vloeiend omdat de grammaticale genderconsistentie wordt geschonden. Het neurale woordenboek produceert vloeiende output door a) de gevraagde vervanging te verbuigen en b) de omringende woorden waar nodig te veranderen. Het kan in sommige gevallen ook de behuizing veranderen, zoals in het volgende voorbeeld:  

Invoer:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Woordelijk woordenboek:   akcje tej firmy schertsen bedanktNi.  
Neuraal woordenboek:   Akcje tej firmy bedanktnie.   

Neural dictionary verwacht dat de gevraagde vertaling van een term wordt geleverd in de grammaticale basisvorm. Termen met meerdere woorden worden ook ondersteund en moeten worden opgegeven als zelfstandige naamwoorden, d.w.z. woorden mogen niet onafhankelijk van elkaar worden gelemmatiseerd (bijvoorbeeld "Estse parlementsverkiezingen" is beter dan "Estlandse parlementsverkiezingen"). 

Hoe neuraal woordenboek in te schakelen 

Voor alle ondersteunde talen die hierboven zijn vermeld, is neural dictionary onmiddellijk beschikbaar voor alle klanten die het Custom Translator-platform gebruiken met Woordenboeken met zinnen. Volledige (of alleen woordenboek) aangepaste modeltraining is vereist om neuraal woordenboek in te schakelen. 

 Aanbevelingen 

  1. Als u ervoor wilt zorgen dat het woordgroepwoordenboekitem vaker wordt gebruikt bij het werken met neuraal woordenboek, kunt u overwegen het woordgroepitem in verschillende vormen toe te voegen aan het brongedeelte. In het bovenstaande voorbeeld wordt naast "oplossing _ alternatywa", kunt u ook de volgende vermeldingen toevoegen: "Oplossing _ alternatywa", "Oplossingen _ alternatywy", "Oplossingen _ alternatywy".  
  2. Als het doel is om ervoor te zorgen dat een specifiek woord of een specifieke woordgroep wordt gekopieerd "zoals het is" van de invoertekst naar de uitvoervertaling bij het gebruik van het woordenboek, overweeg dan om het woordelijke woordenboek af te dwingen, omdat dit consistenter kan zijn.   
  3. Vermijd het toevoegen van vertalingen van veelvoorkomende of veelgebruikte woorden of zinsdelen aan het woordenboek.  

Als u meer wilt weten over Custom Translator en hoe het uw bedrijf kan helpen gedijen op de wereldwijde markt, begint u met de Aangepaste vertaler beginnershandleiding. 

Wat u doen met Microsoft Custom Translator 

Bouw aangepaste modellen met uw domeinspecifieke terminologie en vertaal real-time met behulp van de Microsoft Translator API. 

Gebruiken Microsoft Custom Translator met uw vertaaloplossingen om uw bedrijf te globaliseren en klantinteracties te verbeteren. 

Ga voor meer informatie naar Zakelijke oplossingen van Microsoft Translator En Opmerkingen bij de release van Custom Translator.