隐私|资本涌入、大厂下场、企业内卷 “隐私计算”风口背后追逐的是什么?|GAIR 2021( 二 )


首先分享了数据流通从1.0时代到3.0时代,隐私计算技术发挥的重要的支撑作用,和国内外发展概况;其次从隐私计算解决了什么问题、隐私计算产品的成熟度、可用性、安全性评判、隐私计算的使用与合规以及隐私计算发展趋势进行了深入分析;最后点出了隐私计算面临的三大问题,以及信通院为推动隐私计算更好的应用从政策研究、标准制定、成立了隐私计算联盟等进行的实践。
随着国家数据战略的深化推进,大数据本身的基础设施建设和数据资源的建设,在赋能数字经济的作用价值被人们所看到。如何保障数据在不同主体之间安全可信的共享,隐私计算成为关键技术。
魏凯表示:“数据流通在1.0阶段蕴含了很多的风险,裸数据交付较多,一旦流通出去安全风险不可预估。如今数据流通模式发生改变,隐私计算让数据变成融合后的结果,因此升级进入了数据流通的3.0阶段。”
我们之所以能够跨越到数据流通的3.0阶段,很重要的一个技术前提就是隐私计算这一类技术的支撑。他认为,“虽然隐私计算改变了数据交互与融合的模式,提出了一种新的形态,保障了从数据源、数据传输渠道、数据汇聚通道和使用方等数据流通环节的安全。但实际上没有办法解决数据在流通之前和之后的权属争议,因此也不能成为一种豁免法律义务的挡箭牌,这是毫无疑问的。”
隐私计算产品的成熟度、可用性,也是我们所关注的。考察隐私计算产品的技术水平应该从综合的角度来去评判,包括性能、安全性和准确程度,这三者缺一不可。
“隐私计算的使用和合规不能划等号”。首先,法律法规不会对技术的应用做非常确切的判断,无论是隐私计算技术还是人工智能技术的使用,法律上不会从条文上判断使用是否合法,从合法性给出确切的定义。法律只看是否侵犯相关的利益。因此在实践中要趋近于法律的最小化原则,除了技术之外还要考虑商业模式是否合规、数据来源以及授权是否合法、数据使用的目的是否正当等问题。我们要持续性的看待技术的演进和法律合规落地之间的关系。
最后魏凯指出,目前隐私计算这类产品还面临安全性挑战、性能的瓶颈、互联互通三座大山。未来隐私计算发展趋势会是外部的互联互通和内部融合的发展方向。类似与云计算、大数据平台、数据库、区块链、AI等技术融合发展,平台产品间互联互通,打破隐私计算孤岛。
二、杨强:人工智能建设离不开数据,联邦学习让数据发挥价值
加拿大工程院院士、加拿大皇家科学院院士,微众银行首席人工智能官杨强,带来了主题为《数据要素与联邦学习》的演讲。
隐私|资本涌入、大厂下场、企业内卷 “隐私计算”风口背后追逐的是什么?|GAIR 2021
文章插图

他以“人工智能离不开数据”引入,指明人工智能模型的建设需要数据,但是数据维度、样本数都非常少、数据所属和来源各不相同以及数据安全合规越来越严,因此亟需一个更强的工程和科学发展来应对这种需求,因此提出了联邦学习。联邦学习可以让数据可用而不可见。
他表示从时间上来看隐私计算基本经历了四个发展阶段:安全多方计算(MPC)、差分隐私(DP)、集中加密计算(TEE)、联邦学习(FL)。其实在数据可用而不可见的范畴内,我们可以用各种各样的技术手段来解决问题,进而随着技术不断发展,形成大数据流通和隐私计算的行业生态。
而联邦学习的方法是让“数据不动、模型动”,模型参数加密以不暴露原始数据和各方模型。杨强还介绍了横向联邦学习和纵向联邦学习带来的作用。其中有一个典型的场景:“互联网公司可以提供用户画像的信息,但它却没有银行风险控制的信息。银行有用户借款的信息以及逾期率,但却不知道用户平时上网的行为、看视频的喜好等等。如果能把两种信息聚合起来,那么风险模型就会更靠谱,坏账率也会变低,这就是纵向联邦学习的作用。”