Facebook开源三款图像识别人工智能软件

作者：张霖
2016年08月26日
人工智能, 动态

Facebook今天开源了三款人工智能图像分割（Image Segmentation）软件，分别是DeepMask、SharpMask和MultiPathNet，三款工具相互配合完成一个完整的图像识别分割处理流程，DeepMask生成初始对象mask、SharpMask优化这些mask，最后由MultiPathNet来识别这些mask框定的物体。SharpMask目前已遵循BSD授权协议在GitHub上公开源码。

Facebook的人工智能研究实验室（FAIR）此前曾在多篇学术论文中讨论过以上开源的图像分割技术（论文1、论文2、论文3）。图像分割技术不仅能够识别图片和视频中的人物、地点、物体，甚至能够判断它们在图像中的具体位置（精确到像素级别），为了做到这一点，Facebook使用了一种人工智能技术——机器学习，也就是用大量的数据来训练人工神经网络，不断提高其对新数据的处理判断准确性。

Facebook一直是开源人工智能技术的积极推动者，在开源三款图像分割软件工具之前，Facebook还曾在Torch上开源了一些功能强大的深度学习工具。

深度学习是科技巨头竞争激烈的技术阵地，包括苹果、百度、谷歌和微软都投入重金，并在COCO这样的图像识别竞技场上展开激烈角逐。

据Facbook介绍，图像分割技术对于改进社交软件来说意义重大，例如计算机能够自动识别图片中的物体，这能极大提高图片搜索的准确率和效率，即使这些图片没有添加人工标签。对于视力障碍的用户来说，计算机甚至能给他们念出图片中的内容。

Facebook人工智能实验室的科学家Piotr Dollár在博客中指出：图像识别技术的下一个挑战是视频识别，这方面Facebook的计算视觉技术已经取得一些进展，能够在查看视频的同时理解并区分视频中的物体，例如猫或食物。对视频中物体的实时区分功能将大大提高Facebook视频直播内容的推荐准确性，而且随着技术水平的提升，未来机器将能根据场景、物体和动作的时空变化给出实时的描述。


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    人工智能面临“水荒”
                                      AI基准测试的陷阱：代理性能评估存在误导
                                      亚马逊的“人工”智能骗局
                                      2024年三大AI高薪职位
                                      IDC：人工智能投资回报率高达250%
                                      只有13%的企业员工接受过人工智能培训
                                      生成式人工智能服务管理暂行办法
                                      人工智能会成为新的麦肯锡吗？
                  



标签： COCO, FAIR, 人工智能, 图像分割, 图像识别, 视频识别