文章插图
差分隐私和密码学不太相关,是较新的概念。其思想和工作原理大致可以理解为:在数据中加入噪音,使得统计学相关的查询既能得到有效的数据,又能保证安全。学术上的定义是:通过建模单个参与者对数据造成影响,实现对隐私保护(泄露)程度的量化。
目前,该方法可以分为两种:全局差分隐私,可信的数据管理者收集数据并在数据集的统计结果上添加扰动;本地差分隐私,用户在本地对数据添加扰动后,发送给非可信的数据管理者。
文章插图
从计算角度看,差分隐私能在一定的程度上解决“密码学手段开销过大”的缺点。对比加密方法解决数据计算过程中的隐私泄露,而差分隐私方法解决计算结果的隐私泄露。目前,差分隐私的部署和使用大多为政府机构与互联网巨头。
文章插图
例如,2016年苹果在WWDC大会上宣布使用基于CM- Sketch和阿达马变换的本地化差分隐私技术来保护IOS、MAC用户隐私。相比于布隆过滤器, Count- Min Sketch更适用于频率统计任务;阿达马变换也能有效降低通信开销。但有研究人员认为苹果在实际应用中设置的隐私预算参数超出了可接受的范围,隐私保护能力不够强。
文章插图
微软也有相应的动作,并在2017年将差分隐私方案部署到了win 10系统中。此外微软和哈佛大学合作推出了 OpenDP开源差分隐私平台,希望降低中小开发者应用差分隐私的门槛。
文章插图
阿里巴巴也在 Datatrust隐私增强计算平台中部署落地差分隐私保护的联邦学习决策树训练。
差分隐私之所以受到关注,主要是它有严谨的理论模型,提供了可验证的量化隐私保护机制;提供了传统密码学无法提供的隐私保护手段,具有更轻量级的计算负载,提高了隐私保护效率。
但也存在理论和应用上的挑战。例如在理论层面,数据可用性较差:差分隐私在查询结果中加入随机化,导致数据可用性下降;数据类型有限:缺乏针对复杂数据类型的有效差分隐私保护方法。
在应用层面,差分隐私不适用于单一样本的确切信息查询;复杂应用场景下差分隐私得到的结果误差较大;并且,目前还缺乏测试算法(乃至自动测试算法)是否符合差分隐私的方法。
文章插图
如今,学术界针对差分隐私的机制优化有了一些进展。例如上图所示的最优机制设计、机制后处理、最优机制搜寻等工作。
文章插图
相应地,Shuffle机制、Subsample机制的提出增添了差分隐私放大机制的研究。
针对应用难题,学界也提出了差分隐私正确性测试方法,包括多轮采样与概率论技巧相结合的方法、程序分析的方法等等。
- 设计师|数字货币+云计算+华为!产品覆盖龙芯、鲲鹏,股价刚突破30周均线
- 华为|数字货币+云计算+华为!产品覆盖龙芯、鲲鹏,股价刚突破30周均线
- vivo|一键开启无忧隐私保护体验!vivo OriginOS Ocean使用测评
- 魅族|比iPhone更强的隐私防护,魅族科技做了什么?
- 计算中心|雄安城市计算(超算云)中心主体结构封顶
- 聚时科技分享经验,PRCV2021中国模式识别和计算机视觉学术大会
- 计算机|多点触控,体验互动的乐趣
- 服务技术|保险行业发布一批云计算标准
- 计算|雄安城市计算(超算云)中心主体结构封顶
- 封顶|雄安新区:城市计算(超算云)中心提前完成主体结构封顶