人工智能爆炒中的冷思维,深度学习的地板和天花板在哪里?
无论在中国市场还是欧美市场,对人工智能,尤其是深度学习技术的炒作已经到达白热化的巅峰,各路AI创业公司、项目和技术如雨后春笋。一夜之间,工人、司机、医生、律师、法官、新闻记者、股票交易员甚至码农和黑客都被铺天盖地的人工智能审判日阴影所笼罩(人工智能,提前到来的职业杀手),而过于与人工智能毫不沾边的IT电子消费产品,例如路由器、扬声器、手环、手机APP甚至豆浆机等“智能产品”都纷纷贴上了人工智能的新标签。
在各路新老媒体和“专家”的鼓噪下,人工智能似乎成了一把万能的锤子,任何行业、任何职业、任何应用似乎都可以被人工智能取代甚至革新,但是关于人工智能真正的价值和局限性,参与这波炒作的国内媒体和专家们几乎没有人去关心。正如IT经理网专栏作者赵敏在《让AI发光发热莫发烧》一文中引用的北航计算机学院刘连忠教授的话:
“外行鼓噪情有可原,许多科学技术工作者有时也故意混淆视听。AI现在太热了,不过很快会降温,因为AI自己还只能循序渐进的发展着。”
深度学习技术的潜力和价值毋庸置疑
神经网络技术诞生于上个世纪60年代,但是直到近年随着大数据和计算机性能的发展才变得真正实用起来,尤其是深度学习技术利用复杂的神经网络架构进行的数据模式识别的准确性达到了令人振奋的高水准。2016年初AlphaGo碾压式战胜李世石宣告了一个全新的人工智能时代的到来,这是毋庸置疑的。
其他令业界震动的成果也不胜枚举,例如图像和视频识别(ImageNet大赛心得),超过人类准确性的语音转文本。Google甚至用神经网络代替了旧的谷歌翻译技术架构,使得机器翻译的质量快速拉近与人类翻译的水平(编者按:对英文的语音识别,英文与法文德文等语种间的互译已经非常棒,但中文相关的互译质量依然不好)。
其他可能改变世界的人工智能成果还有很多,例如斯坦福大学研发的人工智能算法(论文)能够根据遥感数据预测农作物产量,准确度比美国农业部还要高。而斯坦福医学院的人工智能算法在判断癌症类型的准确性上甚至超过了高水平的医生。
深度学习不是万能药,也有自己的问题和局限性
在最近举行的湾区人工智能大会上,深度学习算法库Keras的开发者Francois Chollet认为:与人脑能够基于少量的样本和经验做出长期规划,或者高度抽象提炼模型的能力相比,当下火爆的深度学习只不过是比传统的统计和机器学习方法强大的模式识别算法而已,当前的监督式学习和增强学习算法需要大量数据“喂养”,而且只能做定向的模式识别,这大大制约了其实用性。而生成式对抗网络(Generative adversarial networks,GANs)的发明者Lan Goodfellow则在会议上展示了神经网络如何被对抗式样本戏耍,例如下面中间这个人工算法处理过的噪点图像,在人眼中什么也不是,但是与原始图像叠加后能够欺骗人工智能系统做出错误的识别判断。
以在北京过马路这么简单的事情为例,深度学习算法要死上好几千次,而且一不小心就被“脏数据”带沟里去了,表现还不如一条狗。
关于深度学习算法适用的局限性,希伯来大学近日发布了一篇论文《深度学习无法完成的任务》
深 度 学 习 不可能完成的任务
(获取下载密码请关注IT经理网微信号:ctociocom,后台回复:深度学习无法完成的任务)
深入探讨了当前深度学习算法在解决特定类型问题,例如无信息梯度(Non-Informative Gradients)时的局限性。
IT经理网专栏作者、智能制造专家赵敏曾在文章中指出,根据2016年Gartner新兴技术成熟度曲线,智能机器人、认知专家顾问、机器学习、自动驾驶汽车等AI热门技术正处于“期望膨胀期”,接下来可能进入“幻灭期”。如图7所示。而“通用机器智能”,还在遥远的路上。
针对时下人工智能技术的“热播”,杜克大学杜克进化智能研究中心主任、深度学习专家陈怡然教授表示:“AI热不是因为门槛高,恰恰是因为进入门槛低:从公司方面来说,知道点需求,甚至需求都不知道,只是靠觉得AI能解决这个问题、然后靠人脉能忽悠到钱就敢开AI公司的多了去了。至于AI真的能不能解决这些问题,能不能招到能解决问题的人,以后再说。”
突破深度学习的天花板
我们如何突破深度学习的“天花板”,朝着通用人工智能系统进发呢?Keras发明者Chollet目前正在开发一个“深度数学”DeepMath项目,能够模拟数学家的直觉方法来辅助数学定理的证明。另外一种方法是开发更高级的可解释性模型,例如笔迹识别方面,神经网络系统需要学习数十万个样本才能达到满意的识别率,而美国国防部高级规划局DARPA的Launchbury认为,通用模型可以接受笔画级别的整块信息,而不是像素级别的处理,这样人工智能系统就能识别任何字符上的类似笔锋,甚至能够区分外观类似的手写字符,例如9和4.
Facebook人工智能实验室总监,卷积神经网络发明人Yann LeCun提出了一种基于能量的模型(Energy-based models),作为深度学习局限性的突破方法,深度学习神经网络通常智能输出单一结果,例如图像标签或者句子翻译内容。LeCun的能量模型则能够给出一整组可能的输出结果,例如一个句子的各种翻译版本,以及各种结果的打分。
号称深度学习之父的Geoffrey Hinton则打算用“胶囊”(capsules)来替代神经网络中的神经元,Hinton认为这样能更加准确地映射人类大脑皮层结构,而且能够更加有效地抵御Goodfellow演示的对抗式攻击。
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: