Переводчик Microsoft публично освобождает корпус перевода речи
Кристиан Федерман, старший менеджер программы |
В рамках текущих усилий в Microsoft для повышения точности искусственного интеллекта (AI) систем, Microsoft Translator публично выпускает набор данных, который включает в себя несколько разговоров между двуязычными ораторами, которые говорят по-французски, Немецком и английском языках.
Этот корпус, который был выпущен корпорацией Майкрософт с использованием двуязычных ораторов, направлен на создание стандарта, с помощью которого люди могут измерять, насколько хорошо их разговорные системы перевода речи работать. Он может служить стандартизированным набором данных для тестирования двуязычных разговорных систем перевода речи, таких как Функция трансляции Microsoft И Skype Translator.
Кристиан Федерман, старший менеджер программы, работающий с командой переводчиков Microsoft, сказал, что не так много стандартизированных наборов данных для тестирования двуязычных речевых систем перевода речи. «Для качественного тестирования необходимы высококачественные данные»,-сказал Федерман.
Команда Microsoft надеется, что корпус, который свободно доступен, принесет пользу всей области устного перевода и поможет создать более стандартизированные тесты, которые исследователи могут использовать для измерения своей работы против других.
"Это помогает стимулировать поле вперед", сказал Будет Льюис, главный технический менеджер программы с командой переводчика Microsoft, который также работал над проектом.
Загрузить корпус перевода языка Microsoft Speech Здесь.
Узнайте больше об этом выпуске, а также о других способах, которые корпорация Майкрософт работает над тем, чтобы сделать AI умнее и точнее в Блог Microsoft Research.
Подробнее