Microsoft Translator publicznie publikuje Tłumaczenie mowy Corpus
Christian Federmann, starszy kierownik programu |
W ramach trwającego wysiłku w firmie Microsoft w celu poprawy dokładności systemów sztucznej inteligencji (AI), Microsoft Translator publicznie udostępnia zestaw danych, który zawiera wiele rozmów między dwujęzycznych mówców, którzy przemawiają po francusku, Niemieckim i angielskim.
Ten korpus, który został wyprodukowany przez firmę Microsoft za pomocą dwujęzycznych głośników, ma na celu stworzenie standardu, dzięki któremu ludzie mogą mierzyć, jak dobrze działają ich konwersacyjne systemy tłumaczeń mowy. Może służyć jako znormalizowany zestaw danych do testowania dwujęzyczności konwersacyjnych systemów tłumaczenia mowy, takich jak Funkcja live Microsoft Translator I Tłumacz Skype.
Christian Federmann, starszy menedżer programu pracy z zespołem Microsoft translator, powiedział, że nie ma tak wielu standardowych zestawów danych do testowania dwujęzyczności konwersacyjne systemy tłumaczenia mowy. "Potrzebujesz wysokiej jakości danych w celu przeprowadzenia wysokiej jakości testów", powiedział Federmann.
Zespół Microsoft ma nadzieję, że korpus, który jest swobodnie dostępny, skorzysta całe pole konwersacyjne tłumaczenie i przyczynić się do stworzenia bardziej znormalizowanych wskaźników, które naukowcy mogą wykorzystać do pomiaru ich pracy wobec innych.
"To pomaga napędzać pole do przodu", powiedział Z. wola Lewicka, główny kierownik techniczny programu z zespołem Microsoft translator, który również pracował nad projektem.
Pobierz korpus translacji języka mowy firmy Microsoft tutaj.
Dowiedz się więcej na temat tej wersji, a także innych sposobów, w jakie firma Microsoft pracuje nad inteligentniejszą i bardziej precyzyjną pracą w Blog poświęcony programowi Microsoft Research.
Dowiedz się więcej