以隐私的名义,一场数据的战争打响了( 四 )


关于数据的归属权,主流的评论大致有两种观点。
有一方观点认为数据的归属权应该归平台所有,因为用户享受了科技公司提供的免费服务。经济学家薛兆丰曾经引用过著名的「科斯定律」。
一项有价值的资源,不管从一开始他的产权归谁,最后这项资源都会流动到最善于利用他、能最大化利用其价值的人受理区。这是科斯定律的一个重要含义。而在制度设计中,我们应该尽量让这种资源的流动和分配更方便、容易,从而提高各项经济资源的使用效率。
简单来说,薛兆丰的结论是,(资源)谁用得好,就应该归谁。从经济学的角度来说,这是效率最高的方式。
市场研究公司爱德曼·博岚(Edelman Berland)曾对全球 15 个国家的 1.5 万名用户展开调查:「你愿意以牺牲一些隐私为代价,换取更多便利与舒适吗?」有 51% 的受访者表示不愿意,27% 表示愿意,剩下的受访者没有意见或不知道如何回答。
这揭示了一个关于隐私的悖论:公众越来越意识到在线共享数据的风险,但是,为了某种便利,人们依旧在披露自己的数据。
因为用户往往是最没有话语权的,也很难对数据使用产生有效的监督。当科技公司的产品已经成为了某种意义上的基础设施时,用户没有别的选择。举个例子,即使你不同意微信的隐私条款,也很难不使用微信,因为你所有的社交关系几乎都在微信上。
另一方观点认为数据理所当然应该归用户所有。2018 年 5 月 25 日生效的《欧盟通用保护数据条列》(General Data Protection Regulations,GDPR)号称「史上最严格的隐私保护法」。在这部条列中,人类首次在法律层面上明确了用户数据的所有权属于用户,而平台只能管理及合理使用这些数据。
但是在我国,数据的归属权问题还没有明确的结论。我国 2021 年实施的《民法典》明确了「个人信息」的定义和处理原则,必须征得个人同意才能处理个人信息,但没有明确个人信息的归属权。而 2017 年生效的《网络安全法》,包括正在审议的《数据安全法》和《个人信息保护法》,也都未明确个人信息的归属权。法律的缺位,造成了个人数据确权的模糊。
技术带来的问题,最终要靠技术来解决20 世纪 30 年代,由于摄影技术的进步,新闻业开始在报纸中大量使用照片。但这些照片往往未经个人同意。
1980 年,律师萨缪尔·沃伦(Samuel D. Warren)和路易斯·布兰戴斯(Louis Brandeis)就这个问题在《哈佛法学评论》发表文章《隐私权》,这是法学界首次提出了隐私权的概念。
以隐私的名义,一场数据的战争打响了
文章插图
沃伦和布兰戴斯发表在《哈佛法学评论》上的文章:《隐私权》|图片来源:布兰戴斯大学
技术的扩张侵犯了个人的边界,从一开始,技术就与隐私相伴而生。
在眼下数据流通越来越严格,而数据红利将尽的情况下,包括谷歌、英特尔、微众银行在内的许多公司都在开发一种叫做联邦学习或者共享学习的技术。
由于数据合规或者商业竞争的关系,许多数据在行业甚至公司内部都无法流通,这就是公司们头疼的「数据孤岛」问题。
联邦学习是隐私计算的一种。在手机上训练模型后,它只将模型加密上传,而把用户的数据留在了本地。
微众银行的首席 AI 官杨强曾经把这个模型比作是「羊」,而数据就是「草料」。
过去训练模型的做法是从各个草场运草过来喂羊。但是在运送过程中,草有丢失的风险,这就是数据泄漏。
联邦学习的做法是,让这头「羊」走起来,到各个草场自己吃草。这样,草就永远只留在本地,也就没有了丢失的风险。