Microsoft преводач публично освобождава корпус за реч превод
Кристиан Федерман, старши ръководител на програмата |
Като част от текущите усилия в рамките на Microsoft за подобряване на точността на системите за изкуствен интелект (ии), Microsoft Преводач е публично освобождаване на набор от данни, който включва множество разговори между двуезични говорители, които говорят френски, Немски и английски език.
Този корпус, който е произведен от Microsoft с помощта на двуезични говорители, има за цел да създаде стандарт, чрез който хората да могат да измерват колко добре работят техните системи за разговорно говорене. Тя може да служи като стандартизиран набор от данни за тестване на двуезични системи за разговорен говор като Функцията Microsoft translator видео И Преводач на Skype.
Кристиан Федерман, старши програмиран мениджър, който работи с екипа на Microsoft преводач, каза, че няма толкова стандартизирани набори от данни за тестване на двуезични разговорни системи за говор. "Имате нужда от висококачествени данни, за да имате висококачествено тестване", каза Федман.
Екипът на Microsoft се надява, че корпус, който е свободно достъпен, ще бъде от полза за цялата област на разговорен превод и да помогне за създаването на по-стандартизирани бенчмаркове, които изследователите могат да използват за измерване на работата си срещу други.
"Това помага да се задвижва полето напред", каза Уил Люис, главен директор на техническата програма с екипа на Microsoft преводач, който също работи по проекта.
Изтеглете корпуса на езика за говор на речта на Microsoft тук.
Научете повече за тази версия, както и други начини, по които Microsoft работи, за да направи AI по-интелигентен и по-точен в Блог на Microsoft за научни изследвания.
Разберете Повече