巴别塔重建?谷歌人工智能翻译自主发明一种超级语言

Image Credit   Shutterstock.com Willyam Bradberry

机器发明自己的语言八卦人类的是非?请别惊慌,目前机器还做不到这一点,但也许距离我们并不遥远。近日谷歌人工智能翻译工具所取得的成就令人感到吃惊。(如果你想象一下AlphaGo能够战胜人类顶尖围棋大师,并且有望在不久的将来重新发明围棋,也许你就不会太过吃惊)

今年9月份谷歌首次宣布推出基于神经网络的机器翻译系统(GNMT),利用深度学习技术来提升语言翻译质量。最近,GNMT项目的研究者有了一个令人振奋的发现:

谷歌人工智能翻译工具可以把英文日文,英文韩文互译,但最神奇的是,这货在前两对翻译训练的基础上,可以“无师自通”把日文直接翻译成韩文,整个过程不借助英文“桥接”。GNMT的开发者称之为“Zero-shot translation”(下图)

谷歌人工智能翻译zero-shot translation

这个案例表明,谷歌人工智能翻译系统能够将没有直接关联概念和单词联系起来,这是否意味着电脑自己内部形成了一套更深层次的概念体系来作为“中转语言”?谷歌的研究人员认为这种机器自创概念体系已经在人工智能神经网络的内存空间中孕育产生。

换而言之,机器自己内部发明了一种“超级语言”来标记所需翻译的不同语言中含义相近或相同的语句和词汇(下图),这让人联想到圣经中的巴别塔。

谷歌人工智能翻译zero-shot translation2

由于机器学习神经网络内部的自主变化很难描述,目前研究人员还无法对人工智能翻译系统自主生成的语言系统进行深入解读,但有一点可以肯定的是,机器已经可以在没有先验知识和数据输入的前提下,自主进行关联学习,这将是一个潜力无边、威力巨大的颠覆性技术——即自主学习。

自主学习已经成为机器学习的下一个圣杯,今年10月份谷歌收购的DeepMind人工智能公司推出了一种能够根据记忆自主学习的计算机——可微分神经计算机(DNC)。这台神经网络计算系统能够在没有先验知识的情况下提供问题答案,或者说自主学习,从原始数据中自主“总结”知识,并准确回答人类的问题。例如仅仅输入伦敦地铁交通图数据,DNC就能帮人类规划两点间的最佳路线,类似的包括录入家谱数据后,DNC就能回答关于家族中任意两个人之间的关系的问题(youtube视频演示)。

DNC是人工智能发展的又一个里程碑,预示着未来的AI人工智能系统将不再依赖人类输入各种可能的答案(例如AlphaGo需要输入人类数以百万计的对局棋谱),而是自主学习和分析数据,提供答案。持此观点的专家包括斯坦福大学(Stanford University)心智、脑和计算中心(Center for Mind, Brain and Computation)主任杰伊•麦克利兰(Jay McClelland),他认为DeepMind的这篇论文是“人工智能研究中非常有意思的重要里程碑”。

自主学习极大拓展了人工智能的未来空间和潜力,这标志着人工智能在很多领域都将成为比人类更加优秀的“超脑”,而不仅仅是人类的玩具和仆人,多语言翻译只是牛刀小试,冰山一角。

关于人工智能“超级语言”的详细解读,请点击查看谷歌GNMT人工智能多语言翻译研究论文

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

旅美学者,跨行业实践者及观察者。曾被评为谷歌学者和奈特-谋智联合学者(Knight-Mozilla),并将进驻《波士顿环球报》,对其媒体产品和用户数据进行十个月的实地调研。拥有清华大学计算机专业学士及硕士学位,香港大学新闻学哲学硕士学位。联系邮件:songyan@ctocio.com