终于有人把隐私计算讲明白了( 二 )


终于有人把隐私计算讲明白了
文章图片
▲图1-1根据生命周期划分的隐私计算技术
根据数据生命周期 , 我们可以将隐私计算的参与方分为 , 如图1-2所示 。
在一般的隐私计算应用中 , 至少有两个参与方 , 部分参与方可以同时扮演两个或两个以上的角色 。 计算方进行隐私计算时需要注意“输入隐私”和“输出隐私” 。 输入隐私是指参与方不能在非授权状态下获取或者解析出原始输入数据以及中间计算结果 , 输出隐私是指参与方不能从输出结果反推出敏感信息 。
终于有人把隐私计算讲明白了
文章图片
▲图1-2隐私计算参与方的三种角色
联合国全球大数据工作组将隐私保护计算技术定义为在处理和分析数据的过程中能保持数据的加密状态、确保数据不会被泄露、无法被计算方以及其他非授权方获取的技术 。 与之基本同义的一个概念是“隐私增强计算技术” , 通常可换用 。 本文统一使用中文简称“隐私计算技术” 。
现在 , 除了MPC技术外 , 隐私计算领域还呈现出更多新的技术特点和解决方案 。 目前 , 从技术层面来说 , 隐私计算主要有两类主流解决方案:一类是采用密码学和分布式系统;另一类是采用基于硬件的可信执行环境(TrustedExecutionEnvironment , TEE) 。
目前 , 密码学方案以MPC为代表 , 通过秘密共享、不经意传输、混淆电路、同态加密等专业技术来实现 。 近几年 , 其性能逐渐得到提升 , 在特定场景下已具有实际应用价值 。 基于硬件的可信执行环境方案是构建一个硬件安全区域 , 隐私数据仅在该安全区域内解密出来进行计算(安全区域之外 , 数据都以加密的形式存在) 。
其核心是将数据信任机制交给像英特尔、AMD等硬件方 , 且因其通用性较高且计算性能较好 , 受到了较多云服务商的推崇 。 这种通过基于硬件的可信执行环境对使用中的数据进行保护的计算也被称为机密计算(ConfidentialComputing) 。
图1-3展示了各项隐私计算技术的发展时间线 。
终于有人把隐私计算讲明白了
文章图片
▲图1-3隐私计算技术的发展时间线
《腾讯隐私计算白皮书2021》将当前隐私计算的体系架构总结为图1-4 。 一般而言 , 越是上层 , 其面临的情况可能越复杂 , 往往会综合运用下层中的多项技术进行安全防护 。
虽然根据多方安全计算的定义 , 联邦学习(也就是图1-4中的“联合学习”)也应该属于广义的“多方安全计算”范畴 , 但可能是由于当前机器学习比较火热 , 业界普遍将联邦学习单独列出 。
终于有人把隐私计算讲明白了
文章图片
▲图1-4隐私计算体系架构
隐私计算技术可以为各参与方提供安全的合作模式 , 在确保数据合规使用的情况下 , 实现数据共享和数据价值挖掘 , 有着广泛的应用前景 。 目前 ,
在金融行业 , 数据渠道融合与风险控制是业务实施的重要部分 。 作为数据隐私安全的重要保障 , 隐私计算技术在金融领域的应用前景广阔 。
隐私计算技术可以应用于金融行业的获客和风控 , 比如多家金融机构在不泄露客户个人信息的前提下对客户进行联合画像和产品推荐;在多头借贷等场景下 , 在不泄露客户已有贷款数额、各金融机构所拥有的黑名单等信息的前提下有效评估客户的信用情况 , 降低违约风险 。
以征信系统为例 , 银行、小贷公司等金融机构需要通过多个信息渠道对潜在用户的历史记录进行多维度计算分析 。 但由于这些数据具有很高的隐私性 , 且很多信息渠道并不具备足够安全可靠的信息传输管控技术 , 征信系统的数据丰富性不足或者维度缺失 。