算法监管:碳与硅的博弈

几周前参加的一场研讨会,嘉宾与以往那些“峰会”大不相同:有法律专家,有经济学者,有互联网码畜(我),也有行业协会的朋友。这种白龙庙英雄小聚义般的氛围,源自当天的有趣话题:算法推荐与个人信息保护。而这次会议,是围绕《个性化广告合规发展白皮书》的发布展开的,这个报告是由《财经》商业治理研究院与中国社科院大学互联网法治研究中心联合发布,各路专家们碰撞出了很多有趣而深入的观点,我试着从我的视角聊一聊。

算法推荐的规范,个人信息的保护,我们统一简称为“算法监管”。这可以说是近几年全社会对互联网圈最为关注的热点之一了。说个老梗,它就像青少年谈性:每个人都在谈,没人真正知道怎么搞,每个人都认为别人在搞,所以声明自己也在搞。这种热烈而迷茫的局面,是因何而起呢?我们恐怕得站高一点,才能看明白。

迄今,人类社会经历了两次演化进程上的重大变化。上一次是认知革命:因为有了认知虚拟概念的能力,人类可以组织起大规模协作,从而摆脱了缓慢自然选择的限制,以知识的形式传承和进化解决问题的方法;今天,我们正在亲历另一次重大转变,即算法革命:方法的探索与进化,已经可以通过算法建模的方式,在须臾之间超越人类数千年的社会积累。所以,AlphaGo才可以从懵懂的状态开始,在数小时内训练出战胜柯洁的程序。

而关于算法监管的种种热议与困惑,其实都根植于此:如何用我们在人类决策时代建立起的管理体系,来规范和约束算法决策呢?如果没有范式上的升级,这事儿如同让黑猩猩指挥人类的战争一样,必然是南辕北辙。说得时髦点儿,这也是一场碳基生命与硅基生命的博弈!听到这儿有读者要蹦起来了:算法是人设计的啊,算什么生命!殊不知,此问已经蕴含了算法监管中的一大困惑,咱们一会再说。

从这个角度理解的话,对算法监管中的一些问题,我们就要回到更根本的视角重新思考。这次研讨会,给了我很多启发。关于这个“更根本的视角”,咱们来谈几个核心思考,主要涉及到算法监管该“管什么”、“管多紧”、“怎么管”这几个方面。

算法监管该管什么?

首先,我有一个根本诘问:到底怎样才算侵犯隐私?我的意思,并不是这条信息算隐私,而那条不算,而是说我们判断这个问题的时候,根本的标准是什么?“使用”与“侵犯”的边界又在哪里?

举个例子,你把自己的照片加载到PhotoShop,点了个一键美颜,然后得到一张你的“明星化”的照片,高高兴兴放到简历上去了。在这个过程里,有一段算法程序(美颜)得到了你的个人数据(照片),并且产出了服务于你的新数据(明星化照片),这个过程算侵犯你的个人隐私么?

这里的一个关键问题,在于把算法看成是有生命的,还是无生命的。如果是后者,那就与一台你操纵的缝纫机无异,而缝纫机侵犯人的隐私,那是有点行为艺术的说法。而根据目前我们对于算法的普遍认识,将其是为具备自主意识的生命体,恐怕比较牵强。所以,算法用了你的信息,跟某个人看了你的信息,这两者是有本质不同的。

当然,现在的算法多运转于云端,这无疑加重了“对面的机器是人是鬼”的疑虑。然而细细想来,问题的本质并没变。为了避免“隐私保护”这个概念无限的泛化,以便追寻切实可行的监管方案,个人认为这一概念的认定,应该遵循如下原则:在用户同意的前提下,将其个人信息提供给算法予以加工,并将得到的结果服务于其本人的产品体验,不应当视为侵犯隐私。

其实,我们今天监管的总体方向,跟这个也是吻合的。在现有的法规下,用户可以通过“Opt out”的方式关闭系统对自己数据的记录和访问权。而如果用户对此并不介意,那么对面那个机器人,其实并不能把你怎么着。当然,如果平台把你的用户信息提供给了其他合作者,那就已经违反了上面的原则,自然是要严格监管的。

可能有人会抬出魏则西事件来讨论,这难道不是用户信息滥用的后果么?咱可得擦亮眼睛,别让部分舆论把经念歪了!这事儿的根本,在于广告客户的资质与品控问题:就算是一点儿个性化也没有,可是广告库里全是莆田系和老军医,您觉得这种悲剧会少得了么?

在上面的原则下,到底哪些该管、那些不该管,是需要好好斟酌的。如果只要是机器在用的你数据就算侵犯隐私,那所谓监管,其实是无从下嘴的。

算法监管该管多紧?

讨论起算法监管时,有些专家学者,总是脖子冲南脸冲北,一副义正词严的样子,似乎这事就跟杀盗奸淫一样,往死里整就行了。作为一名互联网码畜,我觉得此事还要仔细斟酌,不要矫枉过正。因为,算法监管在保护用户权益的同时,也会带来高昂的社会成本。

利用用户个人信息的的功能,对于今天的数字产品已经不是锦上添花的能力,而是整个互联网的基石。为什么这么说,我们来说几个个性化创造的关键用户价值:

一、使用的便捷性。其实,使用个人信息的首要受益者,是用户本人。比方说,您在家里大屏上爱奇艺的片子看了一半,到地铁上打开手机自动就接上了;把这个场景变得智能一点,今天很多浏览器都会预测你要看的下一个网页,预先加载出来免得转圈儿等。这些功能极大地方便了用户,也不可避免要用到个性化。

二、内容的独特性。就拿今天人人都在刷的短视频来说吧,肯定有人对算法用他的数据做推荐不爽;可是如果把内容变得千篇一律,跟动画版的北京晚报似的,恐怕更多的用户骂着街就走啦!实际上,正是有了个性化的内容推送能力,才让今天的互联网变得如此丰富多彩。

三、商业的可归因性。正是由于互联网上的用户点击链路可以追溯,商家才能精准地归因客户,甚至能够通过数据反馈反向驱动产品设计生产。这带来了万亿级的数字广告市场,也拉动了后面规模更大的产业。如果仅仅取消个性化,那除了让用户看到更多不相干的垃圾广告、整个数字产业地震式崩塌以外,不会有什么有意义的正面结果。而客户而言,数字广告的可归因性大大减少了成本,这无疑中小商家乃至经济生态健康发展的重要性是不言而喻的。

可以说,数字产业的核心能力,就是个性化能力。其总体社会影响,无疑是功远大于过的。当然,个性化也带来了隐私顾虑、信息茧房等新问题,但那是前进中的坎坷,并不是社会的倒退。倒洗澡水如果把孩子倒掉,总是得不偿失的。

所以,算法决策虽然是新事物,却并非洪水猛兽,监管也像大禹治水一样,宜疏不宜堵。如果抡起大棒乱打一气,把数字产业全都阉割了,用户也没尝到啥甜头,再让某些不讲武德的外国企业趁虚而入,那才是亲痛仇快。

算法监管该怎么管?

咱们再来说说,硅基的这些算法机器,要管的话该怎么管。既然要管,先要认清算法决策,与人类决策有何根本不同。

我们来比较一下小孩子学围棋,与AlphaGo有何不同。小孩子送到围棋班,老师教他定式、收官、手筋,然后通过实战熟习这些“基础知识”,提高水平;可AlphaGo不是如此,他全然不懂什么定式手筋,只是在规则确定的“地多者胜”的目标下,建立起一个庞大的神经网络,靠着弹指之间左右互博成千上万次的蛮力,在“什么都不懂”的状态下炼成了绝世高手。

所以,碳基的人类决策,是先建立一个个知识点,然后把它们综合起来做判断;而硅基的算法决策,是个快速演进的巨大黑盒,对它来说最重要的就是目标函数,而像定式、手筋这样的中间态的特征,连AlphaGo的工程师都不知道到底发生了啥。一言以蔽之:人类决策,是自底向上的知识驱动,算法决策,是自顶向下的目标驱动。

这么看来,如今出台了的很多规范和条例,但多数还是在以管理人类决策的方式监管算法决策。咱们说个例子:前些日子,有司要求美团提供在确定订单应该多长时间送到用户手中时,都用了那些参数,又是怎么计算的。您看这事儿,就有点没管到点子上。

为啥没管到点子上?对美团来说,外卖的调度过程,十有八九也是神经网络在决策,原理上跟AlphaGo差不多。订单多长时间送到,对人家来说好比下棋用的某个定式。也就是说,它可能只是神经网络训练得到的一组参数,并非预先的人为设定,也更不是固定的规则。既然如此,搞明白了也是刻舟求剑,没准明天模型一更新,就全变了。

那么,什么才是真正应该管的呢?在算法决策“目标第一性”的原理下,真正该管的是算法的“目标函数”。对美团而言,是在优化用户的平均等待时间?还是骑手的平均收入?还是平台的总利润?这可太不一样了!如果目标函数是平台利润,那你再怎么监管那些具体的特征参数,都无济于事。你把这儿按住了,庞大的神经网络绕个弯儿,还是能达到同样的目标。

这也是我在研讨会上提到的核心观点:监管算法,一定要找到有效地了解其目标函数,并且合法地在目标函数上直接动刀子的方式,才有可能有用。如果就是头痛医头,脚痛医脚,这个不许干,那个改一改,到头来除了留下一大堆法规和条例,怕是什么卵用也没有。

而这一堆无奈的法规条例,只是我们的碳基文明在对硅基算法认知不足的情况下,无力的咆哮罢了。

@-@

说了这么多,简单总结一下的话,主要就是两点:首先,监管算法,绝不能拿它当个人类的精英或组织那么来管,必须要搞清它的根本规律,才有可能不流于形式;其次,算法决策并不是数字时代的撒旦,至少还有天使的另一面。特别是在今天,想回到没有算法决策的时代,那是万万不可能了。只有平衡好产品体验、产业发展与用户隐私,在遵循数字经济规律的基础上,才能管到产业和用户双赢的点儿上。

另外,从国际竞争来看,个性化广告与推荐是国际数字经济竞争很重要的核心领域,我们要正视其作用甚至积极布局规划。实际上,中国的互联网企业能够自立,甚至开始走出国门展现竞争力,也是因为个性化与算法决策能力有了质变。从这个角度看,隐私保护照着欧盟的GDPR来,那算是掉沟里了:欧盟的现状是,自己完全没有网络服务的主导权,那还不如卡严点儿,多罚点儿!咱说句文言:光脚的不怕穿鞋的,反正要死也是死道友不死贫道,那怕啥?

正因为存在范式上的根本升级,我们对算法决策的根本规律,全社会的认知还很不够。所以,算法监管这个问题,很多时候还处在拿着手枪打卫星的思维模式下。多搞点儿跨领域、跨行业的专家和用户交流,对我们认清这场碳硅博弈的局面与走势,帮助太大了。所以,我也是有感而发,在那次研讨会后用本文记下了我的一些思考。

以上这些观点,有些是个人畅想,也有些是受《个性化广告合规发展白皮书》的启发,读者们有对此报告感兴趣的,可以在文末的链接中获得,如果您更多深入的思考,也欢迎留言交流!

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:
标签:


关于作者

《计算广告》作者,资深数据科学家