隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展( 四 )


隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图

根据是否脱离生产环境,数据脱敏可以分为动态数据脱敏和静态数据脱敏。前者对敏感数据的查询和调用结果进行实时脱敏。在访问敏感数据的同时实时进行脱敏处理,可以为不同角色、不同权限、不同数据类型执行不同的脱敏方案,从而确保可用而安全。
后者(静态数据脱敏)是指数据脱敏后分发至测试、开发、数据分析等场景。是数据的“搬移并仿真替换”。将数据脱敏处理后,下发给下游环节取用和读写。脱敏后数据与生产环境相隔离,满足业务需求的同时保障生产数据库的安全。
隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图

如上图所示,数据脱敏有很多方式。例如数据一致性脱敏、遮蔽脱敏、保持数据格式脱敏、泛化脱敏、保持数据特征脱敏等等。
作为数据安全防护工作的重要一环,数据脱敏技术和产品已作为常规手段,而敏感信息依赖于实际业务场景和安全维度,识别和梳理具体业务场景的敏感字段迫在眉睫。同时,目前市场上的数据脱敏供给商可分为信息安全服务服务商、自研自用企业以及通用数据脱敏工具开发商三类。但在全球范围内尚未形成脱敏的具体标准。
隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图

目前,浙江大学与阿里巴巴合作开发了DMS数据管理系统,包含了40万个实例、400万数据库、10亿张表,能够实现根据敏感数据自动分级分类、异常访问风险识别等等功能。
隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图

数据脱敏的应用非常广泛,但也存在一些难点。例如如何确定数据脱敏的目标字段?当前选择脱敏数据目标字段主要依赖于人工标记,在准确性、安全性和高效性上仍有较大缺陷 。
如何保证数据脱敏过程的安全性? 当前主流算法的脱敏过程仍不完善,有泄露和被取击的风险。
如何评判数据脱敏结果的脱敏程度?目前市场上有许多种类的脱敏工具和算法技术,但是没有一种统一的标准来量化和衡量脱敏结果的好坏。
总结一下,数据市场依托隐私计算打破数据孤岛非常重要。从数据脱敏、数据溯源到数据融合,再到数据确权、数据定价,隐私计算已经发展出了非常有潜力的技术,它在未来数据要素化资产市场配置过程中也会起到底座作用。
综上所述,随着数据安全监管与合规要求的日益严格,隐私计算技术所面临的机遇与挑战、困难与希望并存,是未来迎接数字化转型的重要安全问题之一。

推荐阅读
群雄并起,隐私计算创业人的前路在哪里?——七位大咖论道 |GAIR 2021
2021-12-18
隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图
工程院院士孙凝晖:计算机系统的演进规律,从求极致到求通用|CNCC 2021
2021-12-23
隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图
CNCC 2021重磅启幕:与John Hopcroft、孙凝晖等数十位顶级学者,共飨计算机年度盛会
2021-12-17
隐私计算|浙江大学求是讲席教授任奎:隐私计算的前沿进展
文章插图