谷歌开源人工智能图像识别模型和VR音频工具

谷歌人工智能图像识别模型工具

谷歌近日宣布开源两个重要项目:一个是谷歌最新的语义图像分割人工智能模型DeepLab-V3+,另外一个是谷歌的空间音频SDK——Resonance Audio。

“语义图像分割”指计算机识别照片或者视频中多个物体并用自然语言命名的过程。例如谷歌自家产品Google Photo不仅能够发现照片中的狗狗图像,还能够正确地将其标注为“狗”。在官方技术博客中,Google指出Pixel2的单镜头人像模式也适用该技术,但是Google表示DeepLab-V3+并未在Pixel2的拍照技术中应用。

Resonance Audio是Google去年发布的空间音频SDK,直到上周三才得以开源,该技术利用位置数据和声音过滤器在VR或AR应用中提供定位准确逼真的环绕立体声效果。Google在博客中指出,Resonance Audio将帮助开发者在移动端或桌面创建体验更棒的VR或AR应用,并且该SDK已经在《星战:绝地武士挑战》这个APP中得到应用。

上述两个工具的Github链接如下:

DeepLab-V3+Resonance Audio

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

隐私已经死去,软件正在吃掉世界,数据即将爆炸