Vrijeme Jeli na glavniju
Prevoditelj
Ova stranica automatski je prevedena pomoću servisa za strojno prevođenje tvrtke Microsoft Translator. Saznajte više

Blog Microsoft prevoditelj

Neuralni rječnik prilagođenog prevoditelja servisa Azure AI: pružanje veće kvalitete prijevoda terminologije 

Danas smo iznimno uzbuđeni što možemo najaviti izdavanje neuronskog rječnika, značajno poboljšanje kvalitete prijevoda na našu platformu. U ovom postu na blogu istražit ćemo značajku neuronskog rječnika.

Uvod  

Neuralni rječnik je produžetak našeg dinamički rječnik I rječnik fraza značajke u programu Azure AI Translator. Oba omogućuju našim korisnicima da prilagode izlaz prijevoda pružajući vlastite prijevode za određene pojmove ili fraze. Naša prethodna metoda koristila je doslovni rječnik, što je bila točna operacija traženja i zamjene. Neuronski rječnik poboljšava kvalitetu prijevoda rečenica koje mogu uključivati jedan ili više prijevoda termina dopuštajući modelu strojnog prevođenja da prilagodi pojam i kontekst kako bi proizveo tečnije prevođenje. Istodobno čuva visokoročnu točnost prijevoda.  

Sljedeći englesko-njemački primjer pokazuje razlike u rezultatima prijevoda između obje metode kada se traži prijevod prilagođene terminologije: 

Ulaz:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Verbatimov rječnik:   Grundkenntnisse Der RegelmäßigEs Testnešifriran 
Neuralni rječnik:   Grundkenntnisse Des Regelmäßignešifriran Testens 

Poboljšanje kvalitete 

Grafikon u nastavku ilustrira značajna poboljšanja koja nova značajka donosi na uobičajenim javno dostupnim skupovima terminoloških testova u automobilskoj industriji (https://aclanthology.org/2021.eacl-main.271), Zdravlje (https://aclanthology.org/2021.emnlp-main.477) i domene Covid-19 (https://aclanthology.org/2021.wmt-1.69) koristeći naše opće modele prevođenja. 

Također smo proveli niz procjena kupaca na Custom Translator platformi i modelima neuronskih rječnika. Izmjerili smo povećanje kvalitete prijevoda na podatke o kupcima između modela sa i bez proširenja neuronskog rječnika. Sudjelovalo je pet kupaca koji su pokrivali njemački, španjolski i francuski jezik u različitim poslovnim domenama.

Grafikon u nastavku prikazuje prosječno poboljšanje od KOMET u obrazovnoj domeni za englesko-njemački, englesko-španjolski i englesko-francuski; za opće modele s lijeve strane i za prilagođene modele s desne strane. BLUE trake boja predstavljaju opću kvalitetu prijevoda bez neuronskog rječnika, a ORANGE trake boja predstavljaju kvalitetu prijevoda pomoću neuronskog rječnika. To su ukupna prosječna poboljšanja na cjelokupnim skupovima testova. Za segmente, uključujući jedan ili više unosa u rječnik kupca (između 19% i 63%), poboljšanje je čak +6,3 do +12,9 COMET bodova. 

 Podržani Jezici  

  • Trenutno dostupno (od 6. prosinca 2023.): pojednostavljeni kineski, francuski, njemački, talijanski, japanski, korejski, poljski, ruski, španjolski i švedski – na engleski i s njega.  
  • Dodajemo još u budućnosti. Ažuriranja potražite u članku Napomene o izdanju prilagođenog prevoditelja 

Kako funkcionira neuronski rječnik 

Neuralni rječnik ne koristi točnu operaciju traženja i zamjene prilikom rukovanja prilagođenim prijevodom terminologije. Umjesto toga, prevodi pojmove ili fraze iz rječnika na način koji najbolje odgovara cijelom kontekstu. To znači da se izraz može nametnuti ili imati različito kućište ili da se okolne riječi mogu prilagoditi, stvarajući tečniji i koherentniji prijevod.  

Recimo, na primjer, da imamo sljedeću ulaznu rečenicu na engleskom jeziku, a njezin prijevod na poljski bez ikakvih rječnika je sljedeći:  

Ulaz:   Trebamo brzo rješenje koje će biti razumljivo.  
Standardni prijevod:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Ako želite biti sigurni da je "rješenje" prevedeno kao "Alternatywa" ("alternativa" na engleskom jeziku) možete dodati primjedbu dinamičkog rječnika da biste to postigli:  

Ulaz:   We need a fast <mstrans:dictionary translation=”Alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Verbatimov rječnik:   Potrzebujemy szybkiego Alternatywa, który Będzie zrozumiały.  
Neuralni rječnik:   Potrzebujemy szybkiEJ AlternatyWy, którA Będzie zrozumiałA.  

Rezultat dobiven prethodnom metodom ne govori tečno jer se krši gramatička rodna dosljednost. Neuralni rječnik proizvodi tečni izlaz a) nanošenjem tražene zamjene i b) promjenom okolnih riječi gdje je to potrebno. U nekim slučajevima može promijeniti i kućište, kao u sljedećem primjeru:  

Ulaz:   This company’s <mstrans:dictionary translation=”Akcje“>stock</mstrans:dictionary> is cheap.  
Verbatimov rječnik:   Akcje Tej Firmy šala tani.  
Neuralni rječnik:   Akcje Tej Firmy tanie.   

Neuralni rječnik očekuje da je traženi prijevod termina naveden u osnovnom gramatičkom obliku. Podržavaju se i pojmovi s više riječi koji bi se trebali navesti kao imeničke fraze, odnosno riječi se ne bi trebale samostalno lemmatizirati (na primjer, "estonski parlamentarni izbori" bit će bolji od "izbora za parlament u Estoniji"). 

Kako omogućiti neuronski rječnik 

Za sve gore navedene podržane jezike, neuronski rječnik odmah je dostupan svim korisnicima koji koriste Custom Translator platformu s rječnici fraza. Za omogućavanje neuralnog rječnika potrebna je potpuna (ili samo rječnik) prilagođena prekvalifikacija modela. 

 Preporukama 

  1. Ako želite osigurati da se unos rječnika fraze češće koristi pri radu s neuronskim rječnikom, razmislite o dodavanju unosa fraze s izvornim dijelom u različitim oblicima. U gornjem primjeru pokraj stavke "rješenje _ Alternatywa", možda ćete htjeti dodati i sljedeće unose: "Rješenje _ Alternatywa", "Rješenja _ Alternatywy", "Rješenja _ Alternatywy".  
  2. Ako je cilj osigurati da se određena riječ ili fraza kopira "kakva jest" iz ulaznog teksta u izlazni prijevod kada koristite rječnik fraza, razmislite o provođenju doslovnog rječnika jer može biti dosljedniji.   
  3. Izbjegavajte dodavanje prijevoda uobičajenih ili čestih riječi ili fraza u rječnik fraza.  

Da biste saznali više o prilagođenom prevoditelju i kako on može pomoći vašem poslovanju da napreduje na globalnom tržištu, započnite s Prilagođeni vodič za početnike prevoditelja. 

Što možete učiniti s Microsoft Custom Translator 

Izradite prilagođene modele s terminologijom specifičnom za domenu i prevedite u stvarnom vremenu pomoću Microsoft Translator API. 

Koristiti Microsoftov prilagođeni prevoditelj Svojim prevoditeljskim rješenjima koja će vam pomoći da globalizirate svoje poslovanje i poboljšate interakciju s kupcima. 

Za više informacija posjetite Poslovna rješenja za Microsoft Translator I Napomene o izdanju prilagođenog prevoditelja.