从谷歌大脑到深度学习：百度首席科学家吴恩达的新AI时代

作者： CashCat
2014年06月03日
动态, 大数据

在IT尖端人才争夺最为惨烈的硅谷，百度在谷歌后院大张旗鼓招兵买马的一系列动作让人侧目，而全球知名的人工智能专家吴恩达（Andrew Ng）的加盟，则让人们对百度的“深度学习”计划以及吴恩达本人的好奇达到了顶点。

2013年年初，百度成立了深度学习研究院，由董事长兼CEO李彦宏亲自担任院长。人工智能实验室落户硅谷，选址于科技公司密集的库帕提诺，离 Google不到10公里。已先后将前Facebook资深科学家徐伟，异构计算专家、GPU海量解析专家吴韧，“千人计划”国家特聘专家余凯等招至麾下，并不惜重金招聘全球人才。

2014年5月18日，百度宣布将投资3亿美元在硅谷成立一个新的研发中心，负责人为斯坦福大学(Stanford University)人工智能实验室原主任吴恩达(Andrew Ng)。吴恩达曾经帮谷歌(Google Inc.)创建人工智能项目“谷歌大脑”（Google Brain）。他此前待过的一个研究团队曾经成功地让计算机在看过上百万段YouTube视频后学会识别猫。百度成立的这一新的研发中心将主攻人工智能和深度学习，后一领域最近吸引了来自谷歌、Facebook Inc.和微软(Microsoft Corp.)的投资。

前不久，《连线》曝光了百度设立在谷歌后院的人工智能实验室的消息。报道称，该实验室毗邻谷歌总部，其主要任务之一就是探索深度学习算法。4月份时，Andrew.Ng甚至到访了百度，并与百度技术高层进行了会谈。

以下内容节选自《连线》网站最近一篇文章，介绍了Andrew.Ng（吴恩达）、Google Brain与其他人工智能实践，由腾讯科技翻译：

吴恩达如何重拾梦想

有种理论说，人类的智慧来源于一个单一的算法。

这个理论的实验依据是，人类大脑发育初期，每一部分的职责分工是不确定的，也就是说，人脑中负责处理声音的部分其实也可以处理视觉影像。人脑究其本质来说，是一台可以被调试以执行特定任务的通用型机器。

七年前，斯坦福大学计算机科学教授吴恩达偶然接触到了这一理论，这个理论醍醐灌顶般地改变了他对于人工智能本质的理解，重新点燃了他对人工智能技术的热爱，从而改变了他的职业轨迹。据他回忆，“有生以来第一次，我感到自己有可能在人工智能的研究领域取得一点进展。”

吴恩达说，在人工智能技术研究的早期，主流的理念是，人类智慧形成于成千上万个简单代理的协同工作，也就是麻省理工大学教授马尔文·明斯基（Marvin Minsky）所说的“头脑的社会”。工程师们因此相信，要实现人工智能，就必须建立成千上万个独立的计算机模块。一个模块，或者算法，去模拟语言，第二个模块处理发声说话等等以此类推。总之，按照这个早期理念，实现人工智能所需的工作量巨大，难以实现。

吴恩达小时候的梦想就是发明能像人类一样思考的机器，但当他进入大学真正开始接触人工智能时，却正逢上述理念盛行，他很泄气，放弃了对人工智能的研究。后来，他成为大学教授，还不断地打击自己的学生，劝他们也放弃人工智能这一“不切实际的梦想”。直到有一天，他接触到了“人类的智慧来源于一个单一的算法” 的假说，意识到自己以前对于人工智能的理解可能大错特错，他终于重新拾起了儿时的梦想。而“单一算法”这一假说的提出者是杰夫·霍金斯（Jeff Hawkins），一名有着神经科学研究背景的人工智能领域的企业家。

现在看来，这一假说所改变的，不仅仅是吴恩达的职业生涯而已。吴目前的主要研究领域是机器学习技术中的“深度学习”，在计算机科学中属于比较新的领域，深度学习研究的主要目的是打造能像人脑一样处理数据的机器。目前，深度学习的研究已经不限于学术界，谷歌和苹果这样的大公司也意识到了其中蕴藏的巨大机会。吴恩达和谷歌的其他研究人员一起成立了有史以来人工智能领域目标最远大的项目——Google Brain。

瓶颈：神经科学

Google Brain项目的指导思想，是将计算机科学与神经科学相结合，在人工智能领域，这是从来没有真正实现过的。吴恩达说，“我发现工程师（擅长计算机科学）和科学家（擅长神经科学）之间存在着巨大的代沟。”工程师们想要构建成功的人工智能系统，而科学家们却仍未能完全理解人脑错综复杂的工作机制。很长一段时间内，神经科学并不能够为想要建造智能机器的工程师们提供答案。

此外，据加州大学伯克利分校瑞德伍德理论神经科学研究中心（Redwood Center for Theoretical Neuroscience）主任布鲁诺·奥尔斯豪森（Bruno Olshausen）透露，科学家们还总是觉得“大脑研究”是他们的领域，不大愿意与其他领域的研究人员进行合作。

最终的结果就是工程师们开始建造不完全模仿人类大脑运行的人工智能系统，他们鼓捣出来的只能说是“伪智能”系统，产品类似于“Roomba”这样只能用来吸尘的机器人，而不像动画片《杰森一家》（The Jetsons）里的机器人女仆“罗西”T（Rosie）。

在吴恩达和其他一些人的努力下，这样的局面终于开始发生改变，美国国家心理卫生研究所（National Institute of Mental Health）主任托马斯·因瑟尔博士（Dr. Thomas Insel）介绍，“业内已经形成共识，谁能搞明白人脑如何计算，谁就能设计出下一代计算机。”

究竟什么是“深度学习”？

深度学习是人工智能技术朝新的研究方向迈出的第一步。简单地说，深度学习包含了构建能够模仿人类大脑行为的神经网络。这些多层次的电脑网络像人类大脑一样，可以收集信息，并基于收集到的信息产生相应的行为。这些电脑网络可以逐渐对事物的外形和声音进行感知和理解，也就是“认识”事物。

比如，为了赋予机器“视觉”，研究人员需要建立最基本的一层人工神经元，用来探知如物体的边缘形状等基本信息，第二层神经元可以将第一层感知到了物体边缘性状拼凑起来，鉴定较大块的物体形状，然后再加一层将第二层检测到的信息再拼凑从而使机器明白物体整体的形态。这里面关键的一点是，软件可以自行做到这一切——旧的“伪人工智能”往往需要工程师人工输入物体视觉或者声音的信息，然后由机器学习算法来处理这些信息数据。

吴恩达介绍，在深度学习算法之下，我们可以给这个系统很多数据，使其“自己学会世界上的一些概念”。去年，吴的一个深度学习算法机器通过扫描互联网上无数的猫的图片“认识”了猫，机器不认识单词cat，吴需要为机器输入这个单词，然后经过一段时间，机器将这种毛茸茸的小动物与单词cat联系到了一起，可以自行鉴别什么样的事物是 cat。

教机器学习的方法本身就是在模仿人类的学习机制，当我们还是婴儿的时候，我们通过观察周围，开始认识我们接触到的事物，但是如果父母不告诉我们一样东西的名字是什么的话，我们自己无法知道。

当然，吴恩达的深度学习算法目前还比不上人脑的精确性和灵活性，但他说，那一天会到来的。

吴恩达在他的电脑上解释何谓深度学习

从谷歌、中国到奥巴马政府，谁在研究深度学习？

吴恩达不是一个人在战斗，深度学习已经是计算机科学发展的大势所趋。2011年，吴在谷歌内部领导建立了Google Brain项目，最近几个月，谷歌在深度学习领域的投入明显加大，收购了加拿大多伦多大学教授杰弗里·辛顿（Geoffrey Hinton，人称“神经网络研究教父”）创建的人工智能机构。中国搜索巨头百度也建立了深度学习实验室，誓要在深度学习领域投入大量资源。吴恩达称，其他科技巨头公司如微软和高通也都开始招聘于聘请更多研究“基于神经科学的计算机算法”的科学家。

与此同时，日本的工程师开始构建控制机器人的人工神经网络，南非神经科学家亨利·马克曼（Henry Markman）正与来自欧盟和以色列的科学家们合作，希望能利用数千次实验得到的数据在一台超级计算机中模拟出人脑。

研究的困难仍在于我们无法完全掌握人类大脑的工作原理，但科学家目前在这方面进展飞速。中国的科学家正在研究一个新的大脑图谱，他们将之命名为“脑网络穹顶”（Brainnetdome）项目。在美国，随着奥巴马政府宣布将支持筹建一项跨学科的科研项目“基于神经科学技术创新的人脑研究”（Brain Research Through Advancing Innovative Neurotechnologies Initiative，简写为BRAIN项目，该项目也在美国社会引发了许多争议），许多类似的项目正雨后春笋般得涌现，“大神经网络时代”（Era of Big Neuroscience）已经到来。

BRAIN项目筹备委员会上周末召开了第一次会议，本周还将展开更多的项目筹备工作。 BRAIN项目的目标之一，是为绘制大脑复杂回路图开出所需的新技术，种种迹象表明，BRAIN的工作重心就是人工智能。美国政府对BRAIN项目拨款的 1亿美元中，一半来自美国国防部高级研究项目局（Defense Advanced Research Projects Agency，简称Darpa），超过了美国国立卫生研究院（National Institutes of Health , NIH）的拨款数，美国国防部研究部门称，希望 BRAIN项目能够“催生新的信息处理架构或者计算方法”。

如果我们能够搞清楚人类大脑成千上万的神经元如何互相连结以及中枢神经系统存储和处理信息的原理，那么像吴恩达这样的工程师对于“人工大脑”的设想就能够更加清晰，对于人脑的研究成果和数据将能购帮助深度学习算法的研究，也能加速诸如计算机“视觉”、语言分析，以及苹果和谷歌等公司为智能手机提供的语音识别等技术的发展。

“所以我们要学习生物生存使用的技巧，问题的关键在于生物将秘密隐藏得太深了。”加州大学伯克利分校计算神经科学家布鲁诺·奥尔斯豪森（Bruno Olshausen）感慨道，“我们还没有掌握这些秘密所需要的工具。”

未来：得人工智能者得天下

随着移动设备的崛起，“破解人类神经密码”愈发迫在眉睫。由于设备越来越小，我们需要它们运算更快、更准确。然而，随着电子设备的基础元件晶体管的尺寸不断缩小，将它们变得更精确更高效的难度也越来越大。比如，想要加快设备的运算速度，需要给设备提供更多电能，但更多电能会让设备的运算系统更“嘈杂”，也就是说，它得运算精确度会下降。

奥尔斯豪森介绍，目前工程师们智能通过避开问题核心的方式来应对上述问题，力求在设备大小、运算速度、能耗之间取得平衡，而人工智能技术对此则能提供更好的解决方案。“生物科学能让我们直面问题的根本所在，生物内部的转换机制也是天生‘嘈杂’的，但其找到了一个办法来适应和忍受这些干扰噪声甚至对之加以利用。如果我们可以搞明白生物内部应对这些杂音的方法，我们就能开创一套截然不同的计算模型”。

科学家的目标并不是将计算设备变得更小，他们的目标是让计算机能够做到的事情更多。不管背后的算法多么复杂，目前的计算机无法帮助人类去杂货店购买物品，或者帮助人类挑选适合的衣服、钱包，处理这样的事情，计算机需要添加更高级的图像智能识别技术以及像人类一样的注意力和记忆力，如果能够实现这一点，那么计算机能够处理的事情的想象空间将变得无穷大。

“全世界都意识到，如果你可以解决这些问题，人工智能领域存在的无限商机就会被打开。” 奥尔斯豪森预测。

而驱使谷歌、IBM、微软、苹果、百度这些公司竞相开发高级机器学习技术的原因，正是其背后蕴藏的巨大商业潜力。纽约大学教授、深度学习领域的专家燕乐存（Yann LeCun）教授预测，两年内，将出现大量的机器学习领域的初创公司，其中很多可能会被大公司收购。

虽然最优秀的工程师一般不会同时是人类大脑研究的专家，但如今对于计算机科学领域的工程师来说，掌握一些神经科学的知识可能成为巨大的优势。“我们需要与神经科学领域的科学家更加紧密的合作，”百度的余凯表示，正在考虑招聘一名神经科学领域的科学家，“我们已经在与他们合作，但是我们做得还不够。”

吴恩达的梦想正在照进现实。“我有了希望，不只是希望，我们可能能够实现真正的人工智能，”他说，“我们当然还没有找到正确的算法——这可能需要长达几十年的时间，要实现它很不容易，但我看到了希望。”


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    2022 年你应该知道的深度学习技术
                                      人工智能、机器学习、深度学习必读书籍清单
                                      百度Q4净利大涨95%，李彦宏财报信强调：始终将社会价值与人文关怀放在首位
                                      谷歌开源GPipe，高效训练大型深度神经网络
                                      英特尔开源分布式深度学习平台：Nauta
                                      深度学习硬件选购“避坑”完全指南
                                      英特尔开源HE-Transformer，让AI模型能够处理加密隐私数据
                                      并非万能的锤子！论深度学习在信息安全领域的局限性
                  



标签： Andrew Ng, 吴恩达, 深度学习, 百度