终于有人把隐私计算讲明白了

导读:本文将从隐私计算技术的起源开始说起 , 介绍什么是隐私计算 , 以及隐私计算的发展脉络 , 并进一步介绍隐私计算技术的一些应用场景 。
作者:李伟荣
来源:华章科技
终于有人把隐私计算讲明白了
文章图片
假设有两个百万富翁 , 他们都想知道谁更富有 , 但他们都想保护好自己的隐私 , 都不愿意让对方或者任何第三方知道自己真正拥有多少财富 。 那么 , 如何在保护好双方隐私的情况下 , 计算出谁更有钱呢?
这是2000年图灵奖得主姚期智院士在1982年提出的 。 这个烧脑的问题涉及这样一个矛盾 , 如果想比较两人谁更富有 , 两人似乎就必须公布自己的真实财产数据 。 但是 , 两个人又都希望保护自己的隐私 , 不愿让对方或者任何第三方知道自己的财富 。 在普通人看来 , 这几乎是一个无解的悖论 。
然而在专业学者眼里 , 这是一个加密学问题 , 可以表述为“一组互不信任的参与方在需要保护隐私信息以及没有可信第三方的前提下进行协同计算的问题” 。 这也被称为(SecureMultipartyComputation , SMC)问题 。
姚期智院士在提出“多方安全计算”概念的同时 , 也提出了自己的解决方案——混淆电路(GarbledCircuit) 。 随着多方安全计算问题的提出 , 投入到多方安全计算研究的学者越来越多 。 除了混淆电路之外 , 秘密共享)、同态加密等技术也开始被用来解决多方安全计算问题 , 隐私计算技术也逐步发展了起来 。
多方安全计算在20世纪80年代初提出的时候 , 还只是作为一种亟待可行性验证的技术理论 , 而后计算机算力不断提高 , 移动互联网、云计算和大数据等技术快速发展 , 催生了众多新的服务模式和应用 。
这些服务和应用一方面为用户提供精准、个性化的服务 ,, 而所采集的信息中往往含有大量包括病史、收入、身份、兴趣及位置等在内的敏感信息 , 对这些信息的收集、共享、发布、分析与利用等操作会直接或间接地泄露用户隐私 , 给用户带来极大的威胁和困扰 。
针对隐私保护问题 , 学术界开展了大量的研究工作 , 包括多方安全计算技术在内的隐私保护技术在逐步完善发展中得以应用 。 然而 , 隐私缺乏定量化的定义 , 隐私保护的效果、隐私泄露的利益损失以及隐私保护方案融合的复杂性三者缺乏系统的计算模型 , 这就使得隐私信息在不同系统和不同用户间的共享、交换和分析过程中难以被准确刻画和量化 , 阻碍了各类计算和信息服务系统对隐私进行有效、统一的评价 。
针对这一问题 , 2016年 , 中国科学院信息工程研究所研究员李凤华等对隐私计算在概念上进行了界定:
隐私计算是面向隐私信息全生命周期保护的计算理论和方法 , 具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时 , 对所涉及的隐私信息进行描述、度量、评价和融合等操作 , 形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术 , 支持多系统融合的隐私信息保护 。
隐私计算涵盖信息所有者、搜集者、发布者和使用者在信息采集、存储、处理、发布(含交换)、销毁等全生命周期中的所有计算操作 , 是隐私信息的所有权、管理权和使用权分离时隐私描述、度量、保护、效果评估、延伸控制、隐私泄露收益损失比、隐私分析复杂性等方面的可计算模型与公理化系统 。
同时 , 中国信通院根据数据的生命周期 ,, 每个方面都涉及不同的技术 , 如图1-1所示 。 数据存储和数据传输技术相对成熟 , 读者也可能应用过相关技术 。