被玩坏的点评经济如何自救
没有人怀疑在线点评已经成了一门大生意。点评深刻影响消费者决策,直接影响一款产品、一间酒店或者某种服务的销量,同时也能帮助企业改进产品。因此,点评也成了企业营销的兵家必争之地。而蜂拥而至的虚假点评和恶意点评也正在成为电商平台和消费者的头号敌人。
哥伦比亚大学区块链研究项目发博文指出:消费者非常信赖点评,但是在线点评的准确性却急剧下滑,以下是科罗拉多大学教授给出的两个统计数据:
1. 18-34岁的消费者中有91%的人信任在线评论,影响力等同于来自朋友和家人的建议。
2. 只有约50%的在线评论准确反映了正在审核的产品/服务的质量和价值。
所有数字都指出了一个关于在线点评的重要事实:消费者倚重的点评(如今)已经不太靠谱了。
当信息有限或者不对称时,人们倾向于最直接的参考坐标,,而在线评论,尤其是星级评级就是这方面的王道,评分或者星级帮助用户快速了解亚马逊上的产品价值,谷歌地图上的商家位置,Yelp上的商家品质,优步上的车友/司机等等。
不幸的是,这些评分往往并不那么准确。科罗拉多大学的教授们分析了1272个亚马逊产品用户点评后,得出结论认为用户评论相比专业测试的产品质量评分往往缺乏收敛性(瞎子摸象、良莠不齐),对二手产品价格的预测能力也很弱(例如普通消费者对二手汽车的估值很难准确)。总之,研究人员认为,用户评级和评论与消费者信任它们作为客观质量指标的程度之间存在“严重脱节”。
我们推测,信任和准确性之间的这种脱节来自互联网兴起而发生的可访问性的变化。在网络时代,访问权限指的是任何人对产品/服务/内容进行评级的能力,以及在线查看更多评级的能力。我们认为,访问的增长首先导致用户信任和点评准确性的提高,但随着时间的推移,声誉开始变现,导致信任和准确性之间的差异。(编者按:点评经济已经度过了情怀主导的上半场,进入了人性主导的下半场)
点评依然重要
虽然点评正在变得越来越不靠谱,但是人们对点评的依赖却与日俱增,从第一代网红带货大V Oprah Winfrey(参考奥普拉效应),到如今各大电商平台无处不在的UGC点评都是如此。
早在2011年哈佛商学院(Harvard Business School) 的一项研究显示,餐厅在Yelp上的评级每增加一星,餐厅的收入会增加5%至9%。康奈尔大学的研究人员发现,在Travelocity和TripAdvisor这样的网站上,酒店在线评级每增加或减少一颗星,意味着房价随之产生的11%的关联波动。
互联网的点对点性质是一个巨大的原因,因为他人的意见变得更容易获得。在Zendesk完成的一项研究中,88%的客户阅读了影响他们购买决策的在线评论。平均用户评级/评分已成为销售的巨大推动力,现在,几乎每一个电商网站都可以找到用户生成的评级和叙述评论。
而且,评论和评级不仅仅影响客户的购买决策; 投资者和合作伙伴也会关注企业的评论以评估一个品牌或公司如何被公众接受。根据福布斯的研究,投资者准备投资一家企业之前,100%都会看这家企业产品的用户评论。
科罗拉多大学的研究者认为,普通消费者自认为“我们正在进入一个几乎完美的信息时代,消费者可以做出更明智的选择并尽可能少地受到营销人员的影响”,这主要归功于“新信息来源的扩散”。该研究还表明,我们假设用户评级“提供几乎完美的产品质量指标,而且搜索成本很低。消费者现在能做出更好的选择,成为更理性更聪明的决策者,更不容易受到营销和品牌方施加的影响。”
消费者的这种盲从和信任,让商家和营销者们看到了虚假点评的巨大“商机”。
快被玩坏的点评
“更多人依赖评论来决定购买什么或去哪里玩,所以制造虚假点评的的动力越来越大…… 这是一种非常便宜的营销方式。” – 刘冰,伊利诺伊大学教授
虚假活动,僵尸程序和恶意团伙(羊毛党)对互联网来说并不陌生。
在互联网时代,内容营销有了一个“重要”的突变——评论已经成为一种营销形式,并已发展成为一项规模庞大的业务:声誉管理。公司需要声誉,声誉来自人,如果你能以比广告活动更便宜的价格购买它们。
虚假点评的“繁荣”产生的最直接的效果就是在线点评质量的极速下滑,抛开国内如美团、马蜂窝等在点评方面爆出的丑闻,我们来看下国外的数据。根据评级分析工具Fakespot 估计,52%的沃尔玛评论和30%的亚马逊评论是假的或不可靠的。最近一次ReviewMeta的分析显示,仅在2019年3月,亚马逊遭遇了超过200万次未经验证的评论(即未通过亚马逊购买确认的评论) – 其中99.6%为5星。大多数是非品牌电子产品的评级。
这些注水点评哪里来的?Buyamzreviews.com – 这个网站的名字非常直接地回答了这个问题。
如今的消费者目之所及,充斥着各种虚假点评,曾经一度标榜“有温度”、“有态度
、“摸着良心”,手捧小红书的网络评论者或平台,如今已经变成了由机器人和付费演员混编的海军陆战大队。
如今任何“货品”都可以有虚假点评。Claire Catenaccio是哥伦比亚大学在RMP.com(教授点评网站)上评价最高的教授,对他的24条评论有17条来自同一天,而且文风雷同,你懂的。
差评轰炸
在利用虚假评论来操纵结果的所有方法中,评论轰炸必须是最有趣的。大量水军账号的“饱和攻击”,能够彻底搞臭一个产品。这种手法类似对不同意见的“ 西比尔攻击 ”。这些差评轰炸有些来自竞争对手,有些则是网民自发组织的“网络暴力”。
希拉里克林顿发布她的回忆录“ What Happened”几个小时后,“ 数百个一星评价 ”出现在该书的亚马逊产品页面上。
这本书的出版商向美联社表达了这样一句话:“大约有1,500人在一夜之间阅读了希拉里克林顿的书,并且得出了同一个明显或者可怕的结论,这似乎不太可能。” Quartz在1500条评论中写道,“只有338个用户已通过验证购买该书。
希拉里并不是这种袭击的唯一受害者。Firewatch,独立冒险视频游戏,在他们取消了油管当红游戏视频主播PewDiePie的玩游戏帐户后遭到轰炸。Firewatch根据DMCA版权法删除了他的内容,而PewDiePie的粉丝显然不喜欢这种“审查”,因此他们选择在Steam上发起了差评攻击。
如何拯救点评经济
点评质量和准确性的退化最终将威胁到整个互联网商业生态。一些平台已经采取措施来过滤掉虚假点评,最常见的做法是提高点评成本。例如,AirBnB只允许您点评您住过的民宿。而亚马逊将“已验证购买”标签附加给已购买商品的评论者。这些操作在滤除一些点评噪声方面做得很好,但仍然很容易被操纵。耶鲁大学,达特茅斯大学和南加州大学的研究者们发现,酒店所有者依然能够顺利通过“经验证的购买者”的过滤,操纵虚假点评在TripAdvisor和Booking.com上刷评分。在线旅游平台普遍存在的这种刷点评的漏洞,实际上是互联网点评体系的一个漏洞:无法区分个体评论者的权重。
一人一票的互联网点评模式已经成了虚假点评泛滥的根源。
让我们假装你在纽约寻找一家意大利餐厅与今晚的重要人物约会。您会更加信任谁的意见?来自纽约的米其林星级厨师或互联网上的随机游客?
希望你选择了厨师,如果你确定他们没有被贿赂撒谎。
这个例子是为了说明:消费意见不需要搞民主化,我们不应该对产品,场地或其他任何事情的主观质量达成平等的发言权。我们更需要的是精英管理,如果你准备给孩子购买人工智能机器人、为客厅添置一台8K大彩电,购买一辆SUV,去旧金山吃海鲜,去巴黎购物,去塔吉克斯坦骑行,去新疆自驾旅游,今天,你访问的大多数网站平等对待每个人,对于京东上一款护膝,积水潭医院的大夫和70岁农科院广场舞大妈的投票权相同。这种一人一票的模式对于多样化的决策没有意义,因为它没有准确地权衡各种参与者在不同专业领域的知识水平。
声誉系统的重构
网红带货已经成了商家趋之若鹜的渠道,也就是所谓的KOL营销。但是在大的社交平台和电商平台上,更多的粉丝数,更高质量的内容贡献和更权威的专业背景并不能增加你的投票权重。一些网站,例如Yelp,试图给出点评者的“用户画像”,给用户作为决策参考,但这依然不能解决根本问题,或者说系统性的缺陷:
有缺陷的点评激励措施
对于厂家来说,点评是有“价格”的,对于平台来说,关心的是数据输入的稳定性而不是准确性,同时也会从平台的利益来考量如何操纵点评数据,而对于买家或者消费者来说,他们也没有客观准确点评的动机,很容易被第三方操纵出卖自己的点评权力。所有互联网点评系统的根本性缺陷在于,它的功能与所有利益相关方的货币化脱钩。(编者注:点评的价值不是通过系统自身的货币化系统反馈给贡献者,给操纵者留下了“场外交易”的空间)
诚实的动机和说谎的代价
点评系统的第二个根本性缺陷是:人们(用户)倾向于撒谎,因为没有诚实的动机,而撒谎的代价为零。在以色列军队中,训练营结束时,士兵必须填写对训练本身的评估。这时候战友往往会告诉你,“将培训评价为轻松,以便下一个士兵多吃些苦头!”因为评论是匿名的,没有内置的奖励计划,所以,也就没有诚实的动机。
类似的,在大学校园里,当学生被要求在学期结束时填写课程评估时,学生永远不会再上这门课,所以他们常常在点评种低估课程的难度,这样未来的课程学生将会像他们一样吃力,间接“捍卫”学长成绩的价值。
差评的动力
诚实的动机不足,还因为你在整个网络上做出不准确的评论绝对没有任何损失。而如果没有其他激励措施,愤怒/挫折似乎是负面评论的动力。这就是为什么我们看到的负面评价比正面评价多21%。
平台一大就完蛋
当在线评论论坛首次出现时,由于“ 人群的智慧 ”,他们提供了越来越准确的意见“效果抓住了。这些最初的社区很小,成员之间存在着自然的声誉效应,因为很多人都是通过名字相互认识的。由于对互联网的误解消散,对这些评论的信任增长,因为它们确实更靠谱。但随着用户接入量的不断增加和平台规模的成长,自然声誉的影响和约束也在减弱。这降低了每个用户的声誉,并允许虚假评论茁壮成长,显著拉低准确性。现在,准确性和信任度之间仍然存在相关性; 更高的准确性会带来更多的信任,但更多的信任并不一定会带来更高的准确性。事实上,用户对在线评论的信任度越高,他们伪造/操纵就越有价值,从而产生有害的均衡:更准确→更多信任→更低精度→更少信任→更准确…
如果有某种方法可以(1)提高用户识别不准确性的能力,(2)阻止评论的操纵/滥用,以及(3)正确评估评论者对某些主题的专业知识,社区可以在信任和准确。
胡萝卜,大棒和稀缺性
强意见模型应该为准确的评估提供重要的激励。如果用户(通过金钱或其他方式)评论事物,他们会花时间给出更好的决策建议。这样做的一种方法是通过P2P验证,这意味着如果其他用户同意用户的意见,无论是通过点赞支持还是附和提交类似的评论,该用户都应该获得奖励。这可以(某种程度上)通过预测市场实现,即用户下注(背书)产品的好坏,如果大多数买家同意,他们可以获得一些利润。
另一方面是威慑; 应阻止用户提交不准确的评论。这可以是跟激励类似的方式:用户会因为提供无人同意或支持的差评而丢失一些内容。
前两种方法在区块链领域已经有了用例, 例如Token Curated Registries。用户用加密货币下注产品列表,其他人跟进则用户获得通证奖励,反之则损失赌注。
最后一个重要的部分是稀缺性:严格控制用户在一定时间段提供有限数量的评论。如果用户在评论中面临胜负,并且他们每天只能发表意见x次,他们就不太可能滥用或浪费这些评论机会。
加权意见
因为并非所有观点都是平等的,所以它们对不同主题的权重应该不同。在餐馆的情况下,反复验证餐馆点评者的评级应该比其他更重要。设想一个功能如下的评论平台:厨师查理的“餐厅评分”为5,“珠宝评分”为0.5(平均用户评分为1)。他对一家餐馆的星级评价比他对珠宝店的评价影响要大10倍,比普通用户的餐厅评级还要高5倍。因此,当他喜欢一家餐馆时,它会显着影响平均评级,但当他不喜欢一家珠宝店时,也不会够成太大影响。
在意见完全加权和分配的平台中,评论会更准确。恶意营销的投资将受挫。客户评论很难失真。现金将流向提高产品质量+保留用户,而不是用来支持一个善于造势的公司的欺诈行为。然而,如果没有一些分散的共识,以公平和对等的方式实现这一点很困难,我们将在下面讨论。
数据易读性
人们经常谈论数据透明度,但数据易读性如何呢?即使用户能够访问特定产品,服务或其审阅者的足够数据,普通用户也很难完全理解这些信息。更简单的数据是理解和利用以做出更好的决策,操纵意见和评级变得越困难。要返回Yelp统计信息上面提到的例子,Yelp可以很容易地确定不同评级类别的评论者的分数。这样,像Yelp这样的网站可以提高数据易读性向用户提供更多权力。正如作者James Bridle所说:
“那些无法感知网络的人无法在其中有效行动,并且无能为力。”
去中心化
有时,平台本身的集中化可能导致偏见和不准确。即使是消费者报告这样的“良心平台”,它向点评者支付点评费用,被认为是非常准确的,但其实却容易受到某些公司或行业的偏见。通过改变分布,调查中提出的问题或参与者的人口统计,平台可能会显着改变报告的结果。当您考虑CR自身的商业利益和关系时,这似乎是显而易见的。
因此,如果集中式平台不可避免地会有一些偏见,不被个人或者某个公司控制的去中心化平台是否更好呢?与电子邮件一样,无授权协议催生了一些强大的点对点交互,这种类型的模型可能对点评经济和声誉计划很有用。权力下放的一些潜在好处包括:
整个社区投票的意见的公平权重可以在所有网站上使用的单一通用信誉/身份,而不会破坏这些网站的商业模式(例如使用您的GMail帐户登录Tinder,而无需Google收集/销售任何数据)可证明是稀缺资产,以促进货币化或预测市场。不可篡改的的评论和声誉记录。
然而,去中心化的协议也存在一些问题,例如贿赂,共谋和公地悲剧。例如,如果营销人员刷一个好评获得的收益大于去中心化平台上损失的金钱,他们肯定会这样做。
IT经理网点评:如何快速识别水军、刷单评论(同样适用与鉴别京东淘宝评论,仅供参考)
- 评论过于详细
- 横向对比的产品超过两个
- 评论中总是提到,我老婆,我同事,我爸妈,我同学,我朋友blablabla…
- 通常来说,超级会员评论的可靠性会高一些,但也要留神专业点评师,参考第一条。
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: