Пробиви в превода на речта от нашите изследователски екипи
Това е годината на машинно обучение и големи данни. Дали се прогнозира политически резултати, свръхзареждане вашите електронни таблици в ExcelПомага карта заявки за умисъл в търсене или дори Персонализиране на машина за превод за да отговарят най-добре на вашето съдържание – тези изследователски области играят роля в превръщането на технологиите и продуктивността.
Няколко седмици назад, на 14-ия годишен Изчислителни технологии в конференцията на 21-ви век, участниците видяха къде другаде тези технологии ни взимат и го обичаха. Рик Рашид, който оглавява Microsoft изследвания по целия свят, отиде на сцената и в обхвата на осем изречения, получи 2000 + силна тълпа на краката си и аплодират. Беше момент, в който технология е неразличима от магия – и този, който ще подтикне авторите на научна фантастика да започнат да мислят за по-големи предизвикателства пред изследователите да се справят с 🙂
Гледайте видеото, за да видите сами:
Комбинация от мощни технологии са били използвани, за да направи тази невероятна демонстрация възможно: Deep невронна мрежа базирана обработка, съчетана с Високопроизводителните изчислителни технологии позволяват значителен скок в точността на разпознаване на реч. На Технология на Microsoft преводач които използвате всеки ден, е Персонализирани да се поберат най-добре речта на Рик. Новата технология за синтез на реч, която позволява персонализирането на акустичните характеристики, успя да създаде "гласа на Рик" на език, който не говори. Можеш да четеш на Рик блог публикация тук.
Някои от тези технологии вече са на разположение днес, особено водещият в отрасъла превод (Преводач На Microsoft) с възможности за персонализиране (Център за транслатори). Ако сте потребител на Windows Phone, вие се наслаждавате на най-новаторското приложение за превод на всеки телефон в продължение на повече от една година, което включва опит за ранна реч превод, който е настроен за пътни ситуации. Аудио изходът, който чувате Транслатор на Bing уеб сайт използва някои от по-новите синтез на реч двигатели, идващи от нашата реч изследвания. Дълбоко невронни-NET изследвания също е зад нашата аудио/видео индексиране- АНГЕЛ, която се предлага в търговската мрежа.
Вълнението, което беше ромолящи В на Уеб в отговор на тази демонстрация е индикатор за това колко много хора искат да изпитат тази "магия". Има много работа за вършене, но ще видите предимствата на това невероятно изследване в нашите продукти в нашите бъдещи издания.
Викрам Дади
Директор
Microsoft/Bing преводач & проучване на Microsoft