推特开源内容推荐算法代码

Twitter上周五宣布开源(内容)推荐算法代码,该算法用于用户For You时间线的内容推荐。

值得注意的是,Twitter并未开源广告推荐算法代码,并宣称此举会危及Twitter防御攻击者操纵平台的能力。

“我们开源推荐算法的目标是尽可能高的透明度,同时排除任何会损害用户安全和隐私或保护我们的平台免受不良行为者侵害的代码,包括破坏我们打击儿童性剥削和操纵的努力,”该公司表示。

“今天开源的版本也不包括为我们的广告推荐提供支持的代码。我们还采取了额外的措施来确保用户的安全和隐私得到保护,包括我们决定此时不发布与Twitter算法相关的训练数据或模型权重。

Twitter发布了两个独立的GitHub存储库,其中包含其推荐算法的源代码以及为其提供支持的一些机器学习(ML)模型

正如该公司的工程团队所透露的那样,最终出现在“For You”时间线中的推文是由一个名为Home Mixer的服务选择的,该服务使用以下管道:

  • 在称为候选来源的过程中,从不同的推荐来源获取最佳推文。
  • 使用机器学习模型对每条推文进行排名。
  • 应用启发式方法和筛选器,例如筛选出你已阻止的用户的推文、NSFW 内容和你已看到的推文。

“对于每个请求,我们都会尝试通过这些来源从数亿条推文池中提取最好的 1500 条推文,”Twitter 解释道:“我们从你关注的人(网络内)和你不关注的人(网络外)中找到候选人。最终目标是让每个用户的 For You 时间线显示 50% 的相关和最近的推文来自他们的关注者,另外 50% 来自不在其网络中的人,具体取决于用户感兴趣的内容。“

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者