深度学习“民主化”案例:日本农民研发智能黄瓜分拣机
Makoto Koike和他的父母在黄瓜大棚里
自从谷歌人工智能技术在人机世纪大战中击溃李世石,深度学习就像失足跌入养鸡场的狐狸,引发群体兴奋、恐慌和热议。
作为人工智能领域最热门的技术——机器学习的一个分支,深度学习用大量数据训练机器的深度神经网络学习算法,使其对特定信息的判断、处理和预测能力不断接近甚至超越人脑。说通俗点就是用科学方法和海量数据对机器进行魔鬼训练,最后一不小心击败人类拿到了智力奥运金牌。
机器学习能大大提高机器在过去不擅长的领域模仿甚至超越人类的能力,例如下围棋、开车、识别人脸、甚至写代码、发起黑客攻击、炒股、研发新药等。作为最具颠覆性的技术之一,深度学习蕴含着无穷的商业价值,是未来数年谷歌、Facebook、IBM、百度等互联网巨头不惜血本,不顾颜面争夺的“圣杯”。
但令人遗憾是,机器学习作为当下最性感最时髦的IT词汇(VR只能屈居老二),鲜有振奋人心的成功案例,无数即将改变人类历史进程的颠覆性应用都还停留在PPT1.0版本,反倒是特斯拉自动驾驶致命车祸之类的负面案例起到了杀一儆百,一图杀猫的效果:
那么深度学习会是下一个大热必死的技术概念吗?显然不是。最近一位日本老农DIY了一台基于深度学习技术的智能黄瓜分拣机,能够代替人工筛选靠谱黄瓜,秒杀市场上各种热炒的伪智能甚至反智硬件,让人不禁感慨,深度学习原来也可以玩“需求侧改革”。
智能黄瓜分拣机的实操视频
这台智能黄瓜分拣机的诞生过程大致是这样的:
大约一年前,一位名叫Makoto Koike的汽车嵌入式系统设计师辞职回到了父母的黄瓜农场,准备子承父业。但很快他就发现了一个搓火的问题:在黄瓜农场里最困难的事情不是黄瓜种植,而是黄瓜的分拣。
Makoto的父亲精心培育了一种肉质鲜脆的多刺黄瓜,尤其是那些又直又粗又长且颜色鲜艳的多刺黄瓜卖相最好,在菜场中的身价也高得多。但是挑选出这些黄瓜中的精品并不容易,不但繁琐细碎、而且耗时费神。
左边是Makoto父亲培育的黄瓜,右边是市场上平庸的黄瓜
在黄瓜收获的旺季里,Makoto的母亲平均每天要花费超过8小时来进行黄瓜的分拣工作,而且由于培训一个合格的黄瓜分拣员的时间需要数月,旺季也很难通过招募临时工来补充人手。虽然市场上可以买到黄瓜自动分拣机,但这些机器的准确性较差,价格却高的离谱,普通农民基本不会问津。
受汽车行业的自动化生产流水线启发,Makoto决心提高黄瓜分拣流程的自动化程度,但很快Makoto就发现这并没有看上去那么容易。日本果蔬市场并没有黄瓜分类的行业标准,每个农场都有自己设定的土标准,Makoto父母则将自家黄瓜分为九个等级,挑选的标准包括长度、粗细、颜色、弯曲度和表皮完整性等,这里面水很深,学问很大,如下:
歪黄瓜的颜值低,定价也低
就在黄瓜自动化分拣遭遇技术瓶颈一筹莫展的时候,Makoto被谷歌阿法狗击败李世石的消息深深震撼了,他意识到一项颠覆性的技术变革已经到来,深度学习才是破局的“手筋”。
特别让Makoto振奋的是,近年来深度学习在图像识别领域已经取得长足进步,不但能够准确判断图片中的汽车和飞机型号,甚至能够分辨小猫和小花的品种,例如下面这个微软亚洲研究院开发的花卉识别APP,准确率高达90%,远超大多数人类的识别水平。
但是对于没有没有任何深度学习技术基础的Makoto来说,独立开发人工智能系统的难度比隔山打牛还要大,事情的转机来自谷歌去年11月开源的机器学习工具——TensorFlow。(今年四月谷歌发布了支持分布式处理的TensorFlow)
Makoto发现TensorFlow极大拉低了机器学习的门槛,TensorFlow不需要用户掌握部署深度神经网络所需的高级数学模型和优化算法,“把代码样本下载下来,阅读以下说明就可以开干了”,Makoto说道:”上传大量黄瓜照片后,系统的判断精度大大超出了我的预期。“
硬件经验丰富的Makoto很快就搭建了一个黄瓜分拣机的软硬件系统模型,使用树莓派 Raspberry Pi 3来控制给黄瓜拍照的摄像头,第一阶段在TensorFlow上运行一个小规模神经网络来判断图片中的物体是否黄瓜,随后系统将图片提交给一个运行在Linux系统上的更大的TensorFlow神经网络,进行更细致的鉴别分类工作,整个系统的架构流程图如下:
Makoto采用了TensorFlow的样本代码Deep MNIST for Experts,只在卷积、合并等层面做了小小的改动,以适配黄瓜照片的像素格式和分类等级。下面是Makoto研制的黄瓜智能分拣机的原型,7月份就已装配完成,距离谷歌开源TensorFlow仅仅半年多时间,不得不佩服Makoto的“手办”执行力。
下面是分拣臂、摄像头以及控制界面特写:
虽然Makoto的这台智能黄瓜分拣机具备了一定的实用价值,但是必须客观地看到,这个项目距离真正颠覆性的农业智能自动化产品还面临很多挑战。
Makoto认为最大的挑战来自训练数据的匮乏,虽然Makoto花费3个月时间输入了7000条已经被他母亲分类好的黄瓜图片,但是还是远远不够,带来的问题是在实际运用中,分拣的准确度不够高。虽然对训练数据(照片)的判断准确率已经能达到95%,但是实际使用中的准确度仅为70%。Makoto认为这是使用小规模训练数据集的神经网络常见的过度匹配(overfitting)问题。
第二个挑战来自计算资源匮乏。目前的分拣机使用普通的windows桌面电脑来训练神经网络模型(单机版),效率极低,虽然Makoto将黄瓜的图片训练数据压缩成80*80的低分辨率图像,但依然需要2至3天的时间才能完成7000幅图片的模型训练。
使用如此低分辨率的图片训练数据,导致Makoto的系统目前只能通过黄瓜的外形、长度和弯曲度来分拣识别,无法识别颜色、材质、刮痕和皮刺等信息。但提高训练图片的分辨率又会大幅增加训练时间。(TensorFlow已经支持集群,而且谷歌也开始提供Cloud Machine Learning低成本机器学习训练云服务)
虽然农场有限的资源和财力影响了产品的性能表现,但Makoto的智能黄瓜分拣机原型为每一位有志于投身人工智能技术领域的年轻人带来如下几点启示:
1.TensorFlow等开源软件极大地推动了机器学习的民主化进程
2.跨界人才同样能够玩转机器学习,甚至更有优势
3.深度学习的创业机会无处不在,尤其是在需求侧
4.《北京折叠》的预言并非空穴来风:未来第三空间的人连被剥削的价值都将不复存在
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: