微软翻译人员公开发布语音翻译语料库
克里斯蒂安·费德曼, 高级项目经理 |
作为微软内部为提高人工智能 (ai) 系统的准确性而正在进行的努力的一部分, microsoft 翻译人员公开发布了一组数据, 其中包括讲法语的双语发言人之间的多次对话。德语和英语。
这个语料库是由微软使用双语扬声器制作的, 目的是创建一个标准, 通过这个标准, 人们可以衡量他们的会话语音翻译系统的工作情况。它可以作为一个标准化的数据集, 用于测试双语会话语音翻译系统, 如 Microsoft Translator Live 功能 和 Skype 翻译.
基督徒 Federmann与微软翻译团队合作的一位高级项目经理表示, 测试双语会话语音翻译系统的标准化数据集并不多。费德曼说: "你需要高质量的数据才能进行高质量的测试。
microsoft 团队希望免费提供的语料库将使整个会话翻译领域受益, 并有助于创建更标准化的基准, 研究人员可以使用这些基准来衡量他们的工作与他人的关系。
"这有助于推动场地前进" 将刘易斯, 微软翻译团队的首席技术项目经理, 他也在这个项目上工作。
下载微软语音语言翻译语料库 这里.
了解有关此版本的更多信息, 以及 microsoft 正在努力使 ai 更智能、更准确的其他方法。 微软研究博客.
了解更多信息