Twitter开源流量异常侦测工具——AnomalyDetection

Twitter本周宣布开源流量异常侦测工具AnomalyDetection,该工具可以发现那些能够影响网站服务质量的异常活动,例如流量拥堵或垃圾信息机器人。

AnomalyDetection是一个R语言程序包,Twitter通常会在重大新闻和体育赛事期间用AnomalyDetection扫描入站流量,发现那些使用僵尸账号发送大量垃圾(营销)信息的机器人。

流量异常侦测figure_localglobal_anomalies

AnomalyDetection异常扫描

据Twitter透露,AnomalyDetection与Twitter去年10月开源的BreakoutDetection存在互补关系。

流量异常侦测对于号称“地球脉搏”的Twitter来说非常具有挑战性,因为对流量进行长周期跨度(例如一年)的扫描分析时,一些异常活动往往会掩盖掉。此外,流量异常的原因也各有不同,有的是健康的,例如重大新闻事件导致的流量异常,而有的是不好的,例如QPS(每秒查询量)中point-in-time实时性下降可能意味着硬件或数据采集方面出了问题。

Twitter流量异常侦测-长期figure_longterm

长周期流量异常侦测

AnomalyDetection通过GNU公众授权许可协议开源,目前可以在GitHub上下载到源码。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

隐私已经死去,软件正在吃掉世界,数据即将爆炸