Przejdź do głównej zawartości
Translator
Ta strona została automatycznie przetłumaczona przez usługę tłumaczenia maszynowego Microsoft Translator. Dowiedz się więcej

Blog Microsoft Translator

Słownik neuronowy usługi Azure AI Custom Translator: zapewnianie wyższej jakości tłumaczenia terminologii 

Dzisiaj z wielką radością ogłaszamy wydanie słownika neuronowego, który znacząco poprawił jakość tłumaczenia na naszej platformie. W tym wpisie na blogu przyjrzymy się funkcji słownika neuronowego.

Wprowadzenie  

Słownik neuronowy jest rozszerzeniem naszego Słownik dynamiczny I słownik fraz funkcje w usłudze Azure AI Translator. Oba umożliwiają naszym użytkownikom dostosowanie wyników tłumaczenia poprzez dostarczanie własnych tłumaczeń dla określonych terminów lub fraz. Nasza poprzednia metoda korzystała ze słownika dosłownego, który był dokładną operacją znajdowania i zamieniania. Słownik neuronowy poprawia jakość tłumaczenia zdań, które mogą zawierać jedno lub więcej tłumaczeń terminów, umożliwiając modelowi tłumaczenia maszynowego dostosowanie zarówno terminu, jak i kontekstu w celu uzyskania bardziej płynnego tłumaczenia. Jednocześnie zachowuje wysoką dokładność tłumaczenia terminów.  

Poniższy przykład w języku angielskim i niemieckim ilustruje różnice w danych wyjściowych tłumaczenia między obiema metodami, gdy wymagane jest niestandardowe tłumaczenie terminologii: 

Wkład:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Słownik dosłowny:   Grundkenntnisse Der regelmäßigEs TestEn 
Słownik neuronowy:   Grundkenntnisse Des regelmäßigEn TestEns 

Poprawa jakości 

Poniższy wykres ilustruje znaczące ulepszenia, jakie nowa funkcja wprowadza w powszechnie dostępnych zestawach testów terminologicznych w branży motoryzacyjnej (https://aclanthology.org/2021.eacl-main.271), Zdrowie (https://aclanthology.org/2021.emnlp-main.477) i COVID-19 (https://aclanthology.org/2021.wmt-1.69) z wykorzystaniem naszych ogólnych modeli tłumaczeniowych. 

Przeprowadziliśmy również serię ocen klientów na platformie Custom Translator i modelach słowników neuronowych. Zmierzyliśmy wzrost jakości tłumaczenia na danych klientów między modelami z rozszerzeniem słownika neuronowego i bez niego. Wzięło w nim udział pięciu klientów, którzy posługiwali się językiem niemieckim, hiszpańskim i francuskim w różnych dziedzinach działalności.

Poniższy wykres przedstawia średnią poprawę KOMETA w dziedzinie edukacji w zakresie języka angielskiego i niemieckiego, angielskiego i hiszpańskiego i angielsko-francuskiego; dla modeli ogólnych po lewej stronie i dla modeli niestandardowych po prawej. Kolorowe paski NIEBIESKIE reprezentują ogólną jakość tłumaczenia bez słownika neuronowego, a paski kolorów POMARAŃCZOWE reprezentują jakość tłumaczenia przy użyciu słownika neuronowego. Są to ogólne średnie ulepszenia w całych zestawach testowych. W przypadku segmentów zawierających co najmniej jeden wpis w słowniku klienta (od 19% do 63%) poprawa wynosi od +6,3 do +12,9 punktów COMET. 

 Obsługiwane języki  

  • Obecnie dostępne (stan na 6 grudnia 2023 r.): chiński uproszczony, francuski, niemiecki, włoski, japoński, koreański, polski, rosyjski, hiszpański i szwedzki – do i z angielskiego.  
  • W przyszłości dodamy kolejne. Aby uzyskać aktualizacje, zapoznaj się z Informacje o wersji usługi Custom Translator 

Jak działa słownik neuronowy 

Słownik neuronowy nie stosuje dokładnej operacji znajdowania i zamieniania podczas obsługi tłumaczenia terminologii niestandardowej. Zamiast tego tłumaczy terminy lub frazy ze słownika w sposób, który najlepiej pasuje do całego kontekstu. Oznacza to, że termin może być odmieniany lub mieć inną wielkość liter, lub że otaczające słowa można dostosować, tworząc bardziej płynne i spójne tłumaczenie.  

Załóżmy na przykład, że mamy następujące zdanie wejściowe w języku angielskim, a jego tłumaczenie na język polski bez żadnych fraz słownikowych wygląda następująco:  

Wkład:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  
Tłumaczenie zwykłe:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Jeśli chcesz się upewnić, że "rozwiązanie" jest tłumaczone jako "alternatywa" ("alternatywa" w języku angielskim), możesz dodać dynamiczną adnotację słownika, aby to osiągnąć:  

Wkład:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Słownik dosłowny:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Słownik neuronowy:   Potrzebujemy szybkiej Alternatywawy, którA będzie zrozumiałA.  

Dane wyjściowe uzyskane za pomocą poprzedniej metody nie są płynne, ponieważ spójność gramatyczna płci jest naruszona. Słownik neuronowy generuje płynne dane wyjściowe poprzez a) odmianę żądanego zamiennika i b) zmianę otaczających słów w razie potrzeby. W niektórych przypadkach może również zmienić wielkość liter, jak w poniższym przykładzie:  

Wkład:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Słownik dosłowny:   akcje tej firmy jest dziękujęNi.  
Słownik neuronowy:   Akcje tej firmy dziękujęnie.   

Słownik neuronowy oczekuje, że żądane tłumaczenie terminu jest dostarczane w jego podstawowej formie gramatycznej. Obsługiwane są również terminy wielowyrazowe, które powinny być podawane jako frazy rzeczownikowe, tj. słowa nie powinny być lematyzowane niezależnie (na przykład "wybory parlamentarne w Estonii" będą lepsze niż "wybory do parlamentu w Estonii"). 

Jak włączyć słownik neuronowy 

W przypadku wszystkich obsługiwanych języków wymienionych powyżej słownik neuronowy jest natychmiast dostępny dla wszystkich klientów korzystających z platformy Custom Translator z słowniki frazeologiczne. Pełne (lub tylko słownik) ponowne trenowanie modelu niestandardowego jest wymagane do włączenia słownika neuronowego. 

 Zalecenia 

  1. Jeśli chcesz mieć pewność, że wpis słownika fraz jest używany częściej podczas pracy ze słownikiem neuronowym, możesz rozważyć dodanie wpisu frazy z częścią źródłową w różnych formach. W powyższym przykładzie obok pozycji "rozwiązanie _ alternatywa", możesz również dodać następujące wpisy: "Rozwiązanie _ alternatywa", "rozwiązania _ alternatywy", "Rozwiązania _ alternatywy".  
  2. Jeśli celem jest upewnienie się, że określone słowo lub fraza jest kopiowana "tak jak jest" z tekstu wejściowego do tłumaczenia wyjściowego podczas korzystania ze słownika fraz, rozważ wymuszenie słownika dosłownego, ponieważ może być bardziej spójny.   
  3. Unikaj dodawania tłumaczeń popularnych lub częstych słów lub fraz do słownika fraz.  

Aby dowiedzieć się więcej o usłudze Custom Translator i o tym, jak może ona pomóc Twojej firmie rozwijać się na rynku globalnym, zacznij od Custom Translator – przewodnik dla początkujących. 

Co można zrobić z microsoft custom translator 

Twórz niestandardowe modele z terminologią specyficzną dla domeny i tłumacz w czasie rzeczywistym za pomocą Interfejs API Microsoft Translator. 

Używać Microsoft Custom Translator dzięki rozwiązaniom tłumaczeniowym, aby pomóc zglobalizować Twoją firmę i poprawić interakcje z klientami. 

Aby uzyskać więcej informacji, odwiedź stronę Rozwiązania biznesowe usługi Microsoft Translator I Informacje o wersji usługi Custom Translator.