谷歌开源人工智能图像识别模型和VR音频工具

作者： Cashcow
2018年03月19日
人工智能, 动态

谷歌近日宣布开源两个重要项目：一个是谷歌最新的语义图像分割人工智能模型DeepLab-V3+，另外一个是谷歌的空间音频SDK——Resonance Audio。

“语义图像分割”指计算机识别照片或者视频中多个物体并用自然语言命名的过程。例如谷歌自家产品Google Photo不仅能够发现照片中的狗狗图像，还能够正确地将其标注为“狗”。在官方技术博客中，Google指出Pixel2的单镜头人像模式也适用该技术，但是Google表示DeepLab-V3+并未在Pixel2的拍照技术中应用。

Resonance Audio是Google去年发布的空间音频SDK，直到上周三才得以开源，该技术利用位置数据和声音过滤器在VR或AR应用中提供定位准确逼真的环绕立体声效果。Google在博客中指出，Resonance Audio将帮助开发者在移动端或桌面创建体验更棒的VR或AR应用，并且该SDK已经在《星战：绝地武士挑战》这个APP中得到应用。

上述两个工具的Github链接如下：

DeepLab-V3+ 、 Resonance Audio


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    安永推出AI可信度评估工具
                                      自然语言处理NLP开发有哪些值得关注的开源工具？
                                      Facebook机器学习系统能实时审查海量图片中的多国文字
                                      百度发布人工智能模型训练平台EZDL，没有编程经验也能上手
                                      姗姗来迟，微软推出智能手机视觉搜索功能
                                      一周最佳机器学习资源汇总
                                      即将被AI人工智能淘汰的十个IT职业
                                      加入人工智能开源大战：Lyft计划开源人工智能算法测试工具
                  



标签： DeepLab, Resonance Audio, 人工智能工具, 人工智能开发, 人工智能开发技术, 图像识别