浑水是怎么分析YY数据造假的
11日18日,浑水发布研究报告称YY直播几乎全部造假。报告中称,YY直播有大约90%都是欺诈行为。受此影响,欢聚时代跌超25%。
那么,浑水是怎么分析YY直播数据造假,我抽空研究了一下浑水的报告,感觉很受启发,所以本文把浑水的报告画个重点,分享一下浑水的结论是怎么得出来的。
核心研究方法
整个报告中最核心的就是要判定哪些用户是假用户。浑水通过IP地址与IMEI这两个数据来检测:
1.浑水利用了一个第三方数据网站小葫芦网(www.xiaohulu.com),虎牙在曾经的诉讼把这个网站的数据作为诉讼证据,所以浑水认为这个网站的直播数据是可靠的。
2.小葫芦网数据包括每个用户的登陆IP、登录时间和送礼物的情况、以及IMEI(类似于手机序列号,一个手机只有一个号)。大致有两种情况会被认为是假用户。第一种是用户的IP地址为YY内部的IP地址(127.0.0.1或者100.64.0.0-100.64.0.10),但这种明目张胆的造假只占2.5%。第二种是通过VPN来掩盖真实IP地址。这种方式下用户不会显示自己的真实IP地址,但在使用VPN的过程中,可能会出现短暂泄露真实IP和异常IP跳跃的情况。
短暂泄露真实IP:比如一个叫“Dafashijian”的用户(刷礼物排名第4的大户)在监测期间刷了8,908的礼物,其中有50 个记录了IP地址127.0.0.1(内部地址),浑水判断是掩盖真实IP的软件(VPN)切换时短暂故障引起的。
异常IP跳跃:比如一个叫“遗失机器猫的大熊”的用户(刷礼物排名第91的大户),的IP地址在几分钟内从中国到达智利,又经常在几分钟内回到中国。这也是明显使用VPN掩盖真实IP的行为。考虑到在境外访问境内网站不需要VPN,浑水把这类用户也视为假用户。
一旦某个用户被视为假用户,所有使用这个IMEI的用户也会被视为假用户(IMEI相同账号不同,可以理解为用一个手机(或者模拟器)登陆不同账号刷礼物)。
以此基础,浑水给出了几组证据。
第一组证据
1.在2019年12月,浑水通过上述方法跟踪了96432用户,发现其中24.9%受YY控制,他们的礼物占总礼物收入的48%。
2.武汉封城期间,浑水通过小葫芦网从15866个具有武汉IP的用户中随机抽取了96个,96个中的84是假用户,其中55个使用了已经被浑水判定为假用户的IMEI、17个存在异常IP跳跃(封城期间理论上IP地址不应该变化),造假比例为84/96=87.5%
3.在2020 年10 月的国庆期间,YY 举办了一项名为“平台天使”的新促销活动。新直播主将获得由YY控制的“平台天使”发送的礼物奖励,以此作为直播奖励。这些平台天使是公开的假用户,也是一个账号,也有IP地址和IMEI。这82个IMEI中只有26个已经被浑水通过上面的方法判定为假用户使用的IMEI。也就是说浑水的假用户检测方法大约只能识别三分之一的假用户使用的IMEI(26/82),所以可能有一半以上的假用户没有被浑水识别。
整体看,这一组数据已经形成的完整的证据链,能够证明大部分数据是假用户刷的。
第二组证据:前五大公会数据
根据YY自行披露,前五大公会(娱加、话社、舞帝传媒、中国蓝、IR)2018年收入超过了11个亿。浑水还获得了五大公会的信用报告,显示他们2018 年的总收入仅为1.563 亿,与YY数据相比少了85.9%。在2019年,这五大公会仍然是YY前五大公会。
很明显浑水采信了信用报告的数据,但这一部分由于我没有找到五大公会的信用报告所以无法查实。不知道信用报告是否因为避税而少报收入,所以这一组证据我表示存疑。
第三组证据:知名主播调查
在这一部分,浑水对前几大主播一一详查,除了发现大多数礼物来自于假账户之外,浑水还发现了其他的情况。以YY第三大主播李先生为例,在2019 年12月的年度比赛中假用户1310 万元,占总数的96%,这些假用户在下播期间还会狂刷礼物。
从2019 年10月到2020 年1月,假用户给李先生刷了大致为2710 万元人民币的礼物。扣除YY平台扣减的50%的平台费,他应该获得1,350万元。然而,在同一时间段内,与李先生相关的账户(使用同一IMEI)刷了3840 万元礼物。这意味着李先生净现金流出2490万元人民,明显血亏不符合逻辑。而YY 似乎从这些收入中获得了1350万元收入并确认在自己的财报上。
同样的情况在知名主播小洲、芮甜甜的数据上也有出现。自己收到1000万却要刷1500礼物刷给别人肯定不可能,这背后的原因肯定是YY后台操纵的结果,也就是礼物的价值体系可以后台修改以利于刷数据。很多主播在接受采访时也表示其收入主要靠平台发的工资,而数据显示这些主播收到了大量了礼物,也就是说这些礼物实际上是平台刷的无法提现。
这组证据也补充了证据链的重要一环,就是假用户不是主要靠主播或黑产自己创建然后刷数据的,不然主播会有巨额经济损失,明显不可行。也就是说,假用户和YY自己密切相关。
第四组证据:在线约会数据造假
证据链的最后一环就是小葫芦平台上的数据,也就是刷的礼物是否都被YY财报记录为收入。根据浑水测算,YY财报中的收入甚至还比小葫芦平台上的数据高30%,以2020第一季度报为例,差距金额大约为5亿。浑水认为可能是数据平台没有统计在线约会服务的收入。
浑水用同样的方法监测约会室的收入。监视期间,YY 通常每天运行约500 个直播室,通过chrome爬虫等方式可以获取用户的IMEI,确认里面同样大部分是被浑水认定的假用户。排除掉之后,约会室的最高礼物收入约为每周人民币150,000元,即使假设有500名约会表演者,总收入仍仅为每季度1.04亿元人民币,和5亿差了80%。
第五组证据:BIGO
2019年3月5日,YY宣布完成对海外视频社交平台BIGO的全资收购。在本次交易中,YY收购BIGO余下的约68.3%的所有已发行和在外流通的,由其他股东持有的股份,其中也包括欢聚时代董事长兼代理首席执行官李学凌先生持有的BIGO股份,总交易额约14.5亿美元
Bigo作为海外最大直播应用,浑水认为存在和境内一样的问题,浑水的测算和研究方法和对YY live的方法一致,就不一一展开了,最后的结论是60%-80%的收入是伪造的。
此外,浑水认为在收购Bigo的过程中存在利益输送,因为李学凌本身持有大量Bigo的股票,该交易是极其可疑的关联交易。李学凌通过虚构收入使Bigo估值提高,以便提高收购价格,因此巨额收购款进了李学凌的腰包。
除此之外,浑水还对YY的现金情况等提出了质疑,考虑这部分涉及VIE架构相关而我对这些研究不多,就不做说明了。
可以说,浑水的报告形成了完整的证据链,造假一事基本确凿。就在11月17日,百度刚刚宣布以36亿美元收购YY直播,不知道百度在收购YY时的尽调时发现了多少问题?此次做空报告出来,是否会对收购造成影响?我们拭目以待。
来源: HBin
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: