万字说透Web 3为什么可以解决数据使用中存在的难题( 十 )
Q:数据采集应该是自发而是被选择受控制的?受个体控制的数据采集如何保证真实性?自发的数据采集如何保证不侵犯隐私?
A:我认为在安全且完备的隐私算法的技术支持下 , 数据采集应该是自发的 。 原因我之前也说过 , 如果由个体控制 , 数据市场会被大量虚假数据污染 , 也就不复存在的必要了 。 受个体控制的数据采集如果要保证真实性 , 必定要保证拥有足额的惩罚机制 , 例如一旦生产虚假数据被发现 , 将会从数据市场中除名(这意味着数据收益权变为鸡肋) 。 然而 , 在技术无法保证数据采集的隐私安全性时 , 我认为应该保留个体参与数据采集的选择权利(放弃数据采集也意味着几乎放弃数据使用权 , 因为缺乏机器辅助 , 人力几乎无法做到对数据的有效利用) 。
Q:如何确定数据内容与数据标题的匹配“正确性”?即:如果低价值的数据伪装成高价值数据 , 无法提前查看内容的数据需求者如何快捷地进行筛选以便满足自己的需求?
A:同隐私外部性部分 , 寄希望于新技术——你永远可以相信“算法+激励机制” 。 如果你不信的话 , 那改成我一直相信“算法+激励机制”好了 。
Q:零知识证明的提供者 , 如何保证他提供正确论断的动机不受高额利益的影响?设计事前激励机制是个好主意 , 然而如果无法知道数据的准确价值 , 如何调节激励的额度?
A:同隐私外部性部分 , 我对此的终极期待是 , 验证者的角色由人工智能担任 。 现有的解决办法可能会是 , 一旦验证者作恶 , 会被永远踢出节点队伍;但受限于区块链的匿名性 , 我们仍然无法对地址的善恶做出经验性判断 。 正是由于惩罚的失效 , 验证者有动机在面临高额利益诱惑时做出不诚实的证明 。 从某些角度来说 , 如果零知识证明验证者由现实世界受信任的主体担任(即中心化)会带来一个更好的结果 。
Q:在利用市场法为数据进行估值的过程中 , 如何界定非标准化数据的“类似数据”?
A:“类似数据”并非一定要从现状界定 , 或许可以从生产过程入手 , 即按照数据不同维度的分类对数据生产时的相关交易记录进行匹配 , 每个分类统计特征满足要求的数据可以列入该分类下的“类似数据” , 对于结合了所有给定分类的标的数据 , 或许可以用统计学手段对每个“类似数据”的市场价格进行回归来寻找拟合值 。 无论如何 , 数据的估值存在有诸多问题 , 估值方法的目的不是尽可能准确 , 而是尽可能维持市场秩序 , 促进市场来完成价值匹配 。
3、web3数据市场展望
总结一下本文到现在的内容 。
首先 , 从人类生产方式与对应的组织形态的变迁过程中 , 我指出了信息生产两个特征:零边际成本与网络外部性 。 互联网借助这些特征正在逐步完成对传统产业、商业模式的重构 , 也使得人类逐渐向数字化迁徙 。 在这样一个趋势中 , 数据的重要性开始凸显 , 然而web2对数据的使用存在有各种问题 。 具体到数据市场交易 , 又存在隐私边界与保护、数据外部性、数据采集困境、数据价值匹配、数据估值等各种问题 。 基于区块链技术的web3是对传统互联网的革新 , 希望能通过“算法+激励机制”结合的思路去解决众多难题 , 为数据市场的实现提供一个可能 。
那么 , 我对数据市场的期待是什么样的呢?
首先 , 关于数据市场的基础设施 。 关于隐私、数据外部性、零知识证明等 , 现有的技术需要突破 。 高并发、高性能的新公链也会是一个刚需(并且还需要足够的安全性 , 这太困难了) 。 从我个人的角度 , 由于数据市场中很多地方涉及到监管、通行规则确定、个体产权等 , 想在公链上构建是不太现实的 , 全球性的数据市场很可能是在公链实现技术突破后(一般技术突破是在公链 , 嗯) , 由现存政治格局对应的受信任国家间构建稳定联盟链 , 并在底层协议规则得到协商公认后再行发展的 。
- 网购|同一箱牛奶为何实体店卖50元,网上只卖25元?内行人说出了实话
- 相同的价格买小米还是买OPPO或VIVO,网友说出真心话
- iPhone|据说iPhone这个隐藏功能,很多人都不会使用?
- 三星|三星S21跳水1450元,小米12X:该说再见了
- GitHub|狠人!标星 3.4 万的项目说删就删,几行代码搞崩数万个开源项目
- 一加科技|定制X轴线性马达、LTPO2.0屏幕,说一说我心目中最好的开年旗舰
- CPU|一款全透明的手机有多吸引?Nothing把它做出来了
- 魅族|魅族手机终于和魅友说再见了
- 小米科技|小米12值得买吗?不吹不黑,体验半个月后,说说真实想法
- 传感器|马化腾多年来首次透露大消息:腾讯随时可能被替换