从科大讯飞倒下的地方站起来:百度在机器同声传译领域取得突破
由于不同语言的语序不同,传统机器翻译至少会出现一个句子的延迟,因此同声传译被看作是机器翻译以及人工智能自然语言处理的一个难以企及的圣杯,百度公司近日在这个领域取得了重大突破。
本周三中国互联网巨头百度公司推出了首个拥有预判能力和可控延迟的机器同传翻译系统——STACL(Simultaneous Translation with Anticipation and Controllable Latency)它是一个能够进行高质量双语同传的自动系统,代表了自然语言处理方向的重大突破。(论文下载)
根据百度研究中心的博客,百度发布的人工智能机器翻译工具可以根据互译语言之间的相似度设置1-5个词的可控延迟,以接近人工同声传译的速度和质量翻译(上图)。
在机器同传领域,百度联合语音技术、机器翻译技术,从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。
在语音识别方面,区别于传统的上下文相关建模技术,百度提出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。
在翻译质量方面,提出了“语音容错”的对抗训练翻译模型,根据语音识别模型常犯的错误,在训练数据中有针对性的加入噪声数据,使得模型在接受到错误的语音识别结果时,也能够在译文中纠正过来。比如,语音识别系统将“大堂”错误的识别为“大唐”,这一对噪声词将被自动收录到训练数据中,并将源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”,而保持目标语言翻译不变“Let’s meet at the lobby of the hotel”,同时将这两个中文句子用于训练,进而获得具有更强的容错能力模型。
百度研究中心的博客指出,最好的同传译员的译出率约 60% (大约 3 秒钟的延迟),而百度的新同传系统比传统的整句翻译少了 3.4 个 BLEU 点(BLEU 是通过比较机器翻译结果和人工翻译来衡量整句翻译质量的标准评估指标)。在采用等待三词模式(wait-3-words model,指英语翻译比汉语语音落后三个汉字,约 1.5-2 秒的延迟)的汉英同传中,翻译质量的单一参考 BLEU 分数为 15.3 分,而传统的整句(非同步)翻译要高出 5 分左右。如果允许五个字(约 3 秒)的延迟,这种准确率差异会缩小到 3.4 分左右。
虽然机器同传的理论译出率能大大高于人类同传,但是百度认为现在认定机器翻译取代人工同传为时尚早,未来很长一段时间我们都离不开人类同声传译员,但是百度人工智能同传工具的出现,可以让过去超高强度的同传工作(同声传译人员需要每20-30分钟轮换,否者翻译错误会快速增加)变得更轻松,更普及。
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: