隐私|「跑马圈数据」时代,12位产学研专家眼中数据要素与数字金融的「真相」( 二 )


还有一个重要研究方向,是激励机制的建立。例如利用区块链来记录审计,每一个数据拥有方对整个联合模型的贡献。这就需要一个公平的利益分配原则,需要经历机制设计的过程。
应用方面,首先在金融的交叉营销、反洗钱,可以通过联邦学习把他们的数据联合建筑,把模型的特征空间加以扩充,完成联合建模;以及医疗诊断、物联网、无人车网络等。
总体来说,联邦学习是多学科的交叉,包括安全合规,如何防御攻击和提升教育,如何广泛的来进行技术应用,还有如何建立这种联邦机制联盟的机制,以鼓励大家持续的为经济体为生态贡献。
而隐私计算的商业模式也逐渐形成,例如平台建设方靠硬件产品部署和提供利用项目建设的方式收费;咨询服务商帮助大平台进行数据价值解读,利用数据运营等。
香港科技大学智能网络系统实验室主任、星云Clustar创始人陈凯,与清华大学金融科技研究院副院长、华控清交创始人徐葳也就隐私计算和数据要素两大主题,带来了一场深度对话。
数据保护现状是否也促成了更多潜在的商业机会?对此,陈凯表示机遇与挑战并存,面临的挑战首先是产品;徐葳则指出,长远来看,挑战仍然在于数据能否带来价值。
而对于技术应用角度如何积极适应规则,陈凯表示,很难有一个技术/算法能够最小地完成最小影响,最小范围、最短时间;法规是在技术研究上给予约束条件,帮助推动研发和落地的进程。
当被问到隐私计算未来发展的特征,陈凯表示建立安全的数据网络意义重大,如何处理大量不同机构间的异构数据、性能和规模上处理海量数据、如何让利益共享的性能有指数级的提升,当中有许多值得努力研究的难题。
徐葳则笑称“只有烂大街的技术才是好技术”,认为一项新技术未来的表现,要看技术本身能否成功、使用门槛能否降低。数据源也在逐步有机生长,很多不同行业、不同地区的小平台被建立起来交换数据,如何让这些异构平台也增长成功、小的计算方法和技术整合起来,实现规模经济,也值得关注。
百度安全产品总经理韩祖利也认为,数据要素呈现几大趋势特性:规模上升,类型增加,数据价值密度降低,应用场景也在泛化。
在他看来,当代数据安全的核心要义:应对强对抗的安全问题,非对抗安全和内部使用的权限、审计,隐私保护。因此一个方案如果诞生,应具备三个特点:覆盖数据全生命周期,一体化的集中治理平台,和合规的数据使用、流通形式。
成都大数据集团总经理顾勤就表示,关于科学要素流通的创新实践主要有三个阶段:公共数据运营;整体数据流通,政府的公共数据和社会企业的数据间产生碰撞;产业数据的协同。
以第三阶段为例,即产业数字化,有两种方式:传统产业的体能升级;创新产业的协同效应,通过系统的互联、数据的交互,产生新的价值和场景。
第四范式副总裁、主任科学家涂威威,则在演讲中提出这样一个问题:传统的数据安全设计,能够覆盖AI应用的范围吗?
在训练到预测的许多环节里,都出现了他们预想不到的攻击方式。多种看似正常合法、实为攻击的手段,已经发展颇为成熟。
例如AI公司对外提供信用卡授信模型,攻击者可以通过不断申请、使用授信服务,将反馈回来的数据用于“猜测”那个授信模型。如果这样的新模型被训练出来,攻击者有可能就会猜到训练集的内容,相当于数据泄露,但该过程中的行为均是合法的。
很多研究陷入了停顿状态,AI应用是一个广大的系统,攻击者能以任意方式攻击。在实际应用当中,即便这部分防住了,其他地方依然有很多的缺口。而AI相关理论目前尚未辨析清楚,如果用于引申的AI应用当中,其实际指导作用十分有限。