此页面已由微软翻译机翻译服务自动翻译。 了解更多信息

微软翻译博客

Microsoft 翻译人员在其产品中加速使用神经网络

整整一年前,Microsoft Translator 向所有人提供了一种新的AI技术:神经机器翻译(NMT)。 .从那时起,团队一直在努力扩大 NMT 的使用范围,以改进 Microsoft Translator 文本和语音 API 以及所有 Microsoft Translator 支持的产品中的翻译。

今天,微软翻译家团队宣布了NMT技术的几项进展,无论你如何使用,都能让先进的AI翻译变得更加方便。

  • 10种新的语言,现在在API和应用程序中都可以使用NMT的10种新语言。
  • 现在所有的中文和印地语API流量都是由NMT提供的,开发者不需要做任何事情就可以使用。
  • 新的 "混合型 "翻译可供API和应用程序用户使用,为NMT上还没有的语言带来了神经翻译的好处。
  • 随着语音识别LSTM系统在语音API中发布语音识别LSTM系统,语音翻译端到端的技术已经开始发力了
  • NMT现在也可以提供现场服务。

NMT技术改变了机器翻译,与现有的行业标准统计机器翻译(SMT)技术相比,NMT技术在翻译质量上取得了重大进步。NMT在翻译前能更好地捕捉到完整句子的上下文,提供更高的翻译质量和更人性化的输出。了解更多关于 NMT 如何工作 在微软翻译网站上, 观看下面的视频, 看看 nmt 是如何集成到微软翻译的语音翻译。

你可以在今天的NMT新动力翻译中尝试一下,在 Translator for Bing,在 微软翻译应用程序, Edge,在 翻译 PowerPoint 添加到, 当然,还有微软翻译器 文本演讲 API。

介绍10种新的NMT授权语言

微软翻译器在其NMT系统列表中增加了10种新语言----现在有21种语言,而且还在不断增加!微软翻译器现在支持以下语言的翻译(NMT中的新语言)。NMT 现在支持以下语言的翻译(新的语言为 大胆).

阿拉伯语

保加利亚语

中文

捷克语

丹麦语

荷兰语

英语

法语

德语

印地语

意大利语

日语

朝鲜语

挪威语

波兰语

葡萄牙语

罗马尼亚

俄语

西班牙语

瑞典语

Turkish

100%的中文和印地语翻译搬到了NMT

微软正在为开发者提供更多的NTM功能。具体来说,所有的中文和印地语翻译到英文,现在都默认使用我们新的NMT系统。 这意味着开发人员不需要在他们的应用程序中调用 "generalnn "类别,就可以从这些新系统中受益。对于其他语言来说,这个类别仍然需要,但在未来几周和几个月内,额外的语言将被转换为100%的NMT。

对于那些希望暂时继续使用SMT系统的开发者来说,例如,如果他们已经建立了海关系统,使用了 枢纽, 可以在调用 API 时使用 "SMT" 类别。

"混合型 "神经/统计翻译

在混合翻译中,当你所翻译的两种语言中只有一种语言是由NMT驱动的时候,你仍然会看到翻译质量的提高。

由于语言之间的可用训练数据的稀缺性,以及为每一对语言构建和运行专用系统的指数级复杂性,机器翻译系统将英语作为 "支点语言",从一种语言翻译到另一种语言。这意味着,每次要求机器翻译系统将中文翻译成西班牙语等语言时,翻译系统通常会先将中文翻译成英文,然后再将英文翻译成西班牙语。

使用混合翻译,当两种语言中至少有一种语言有可用的NMT系统时,Microsoft Translator会自动使用NMT来完成该部分的翻译。这一部分的翻译将得到改进,使整个翻译效果更好。请查看我们在微软支持论坛上的文章 了解有关混合翻译的更多信息.

端到端的LSTM神经网络驱动的语音翻译,显著提高语音翻译质量

语音识别正向高级化发展 LSTM 神经网络架构。结合可用语音数据的增加,LSTM语音识别提高了语音识别的质量(通过行业标准的"单词错误率"),最高可达29%,这取决于语言的不同。这对机器翻译的质量有直接影响,因为语音识别的准确度越高,得出的翻译结果就越准确。

Microsoft Translator的NMT使用LSTM技术,因此,现在的语音翻译从头到尾都在使用LSTM技术。试着用 Microsoft Translator 实时功能的 LSTM 语音翻译端到端的语音翻译功能。 翻译 PowerPoint 添加到,关于 http://translate.it微软翻译应用程序Ĥ,或在 翻译语音 API.

处所神经网络

对于需要额外数据安全的企业来说,神经网络翻译现在也可以使用企业自己的服务器而不是微软Azure云服务,作为驻地服务提供。了解更多有关 微软翻译公司的前提下提供.

 

从博客中了解更多 微软研究认知服务.