Facebook机器学习系统能实时审查海量图片中的多国文字
Facebook需要一个可以定期处理大量内容的光学字符识别系统(OCR),这也是Facebook“Rosetta”项目的初衷。如今Rosetta每天可以实时从多种语言中提取超过十亿个图像和视频帧的文本。
在一篇新的博客文章中,Facebook介绍了Rosetta的工作原理(上图):Rosetta首先检测可能包含文本的图像中的矩形区域。然后使用卷积神经网络来识别和转录在该区域中写的内容,甚至是非英语单词或非拉丁字母的语言,例如阿拉伯语和印地语。为了训练这个系统,Facebook使用了人机和机器注释的公共图像。
Facebook和Instagram的各路团队已经在使用Rosetta来展示推荐和监管海量内容。Facebook还计划继续增加Rosetta可以识别的语言种类,并加强从视频帧中提取文本的功能。
最近,Facebook增加了24种新语言的自动翻译服务,包括塞尔维亚,白俄罗斯,马拉地语,僧伽罗语,泰卢固语,尼泊尔语,卡纳达语,乌尔都语,旁遮普语,柬埔寨语,普什图语,蒙,祖鲁,科萨和索马里。Facebook坦承这些语言的翻译尚处于早期阶段,因此仍然会有较多错漏。
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: