万字说透Web 3为什么可以解决数据使用中存在的难题( 九 )


Q:数据存储于巨头的中心服务器之上 , 他们也不会去刻意记录每一次拷贝的细节;
A:区块链将数据存储于分布式账本之中 , 由去中心化的矿工们进行维护 。 目前似乎无法记录数据的查阅记录 , 但这并没有必要 , 因为可供查阅的记录一直是公开透明的 , 未来如果是涉及到隐私的私人数据 , 将会由对应的算法进行保护 。 任何查阅都将需要支付成本并拥有交易记录的 。
Q:不同机构拥有自己的数据库 , 来自于无效的重复性采集;
A:由于底层的数据共享 , 区块链的使用者无需进行重复采集 , 他们只需要使用模块化前端或者自己去爬取即可 , 他也完全可以和他人共享这些成果 。 无所谓共享 , 本就是公开透明的 。
Q:数据的存储与管理不成系统 , 存在大量失真;
A:但凡被记载在链上的都是经过共识机制下矿工群体的确认 , 由于账本是分布式的 , 因此不存在丢失的问题;对于严重的分歧 , 会在社区投票后进行分叉 。 历史仍然可以被真实记载 。
Q:机构间形成数据孤岛 , 缺乏互操作措施;
A:数据共享 。 模块化产品将更有利于互操作 。
Q:非正当的数据交易频发 , 信任成本畸高;
A:所有公开数据无需非正当交易 。 非公开数据的交易是完全自由并且会被记载 , 无需单独的信任程序 , 因为算法实现了这一点 。
Q:如何定义隐私的边界?隐私的边界该由个体选择还是群体选择?
A:关于隐私边界存在有一个概念叫“合理隐私期待” , 在1967年凯茨诉联邦案中为解决隐私权的边界问题提出 , 由于凯茨使用的公共电话亭被联邦官员窃听 , 凯茨将其告上法庭 。 美国最高法院认定“保护人民而不是保护场所” , 意思是只要个人的行为意愿并非想要公之于众并刻意避免引起注意 , 即使发生在公开场合也是可以被保护的 。 然而这个概念存在有一个致命问题 , 那就是没人知道“个人的行为意愿”到底是善意还是恶意 。 正如我前面所举的例子 , 恐怖分子并非想要公之于众并刻意避免引起注意 , 这样的隐私该受到保护吗?
我个人的观点是 , 如果隐私不具有外部性 , 这种隐私就该受到保护 。 一旦个人隐私对外界产生不良影响(负外部性) , 就需要有人来为此负责 , 产生负外部性的个体应该支付成本使得社会恢复原样 , 就如同污水治理问题规定污水排放权一样 。
然而前面又说了 , 不确定负外部性来自于谁 , 只能查看全部个体的隐私来进行搜寻 , 这种行为反而又造成了另一种负外部性 。 是否存在有这样的一种技术 , 对信息查询者的任意问题由机器进行零知识证明验证 , 从而解决上述难题呢?
对于后一个问题 , 我认为应由群体选择基本边界 , 外部性原则确定客观边界 , 二者并集即为法定隐私边界 。 而个体可以根据个人选择 , 在法定边界的基础上自由选择维持隐私还是通过使用私人数据获利 。
Q:如何平衡监管与个体权利?
A:恕我愚昧 。
Q:如何处理隐私的外部性?
A:区块链技术由“算法+激励机制”驱动 , 当交易发生在链上时 , 可以将多个交易方进行划分 , 同时一组交易中的多个子交易也可根据公共/私人等不同性质进行划分 , 如果能够明确任意交易中不同节点的归属 , 就可以由此进行产权划分 , 解决数据外部性问题 。 (以上为我胡诌)隐私同样属于数据 , 但隐私外部性还存在问题 , 即如何事前预防作恶 。
Q:数据的外部性似乎不可避免 , 我们又如何去为数据确立明晰的产权呢?
A:以上 。