万字说透Web 3为什么可以解决数据使用中存在的难题( 九 ) 免责声明：本文旨在传递更多

Q：数据存储于巨头的中心服务器之上，他们也不会去刻意记录每一次拷贝的细节；
A：区块链将数据存储于分布式账本之中，由去中心化的矿工们进行维护。目前似乎无法记录数据的查阅记录，但这并没有必要，因为可供查阅的记录一直是公开透明的，未来如果是涉及到隐私的私人数据，将会由对应的算法进行保护。任何查阅都将需要支付成本并拥有交易记录的。
Q：不同机构拥有自己的数据库，来自于无效的重复性采集；
A：由于底层的数据共享，区块链的使用者无需进行重复采集，他们只需要使用模块化前端或者自己去爬取即可，他也完全可以和他人共享这些成果。无所谓共享，本就是公开透明的。
Q：数据的存储与管理不成系统，存在大量失真；
A：但凡被记载在链上的都是经过共识机制下矿工群体的确认，由于账本是分布式的，因此不存在丢失的问题；对于严重的分歧，会在社区投票后进行分叉。历史仍然可以被真实记载。
Q：机构间形成数据孤岛，缺乏互操作措施；
A：数据共享。模块化产品将更有利于互操作。
Q：非正当的数据交易频发，信任成本畸高；
A：所有公开数据无需非正当交易。非公开数据的交易是完全自由并且会被记载，无需单独的信任程序，因为算法实现了这一点。
Q：如何定义隐私的边界？隐私的边界该由个体选择还是群体选择？
A：关于隐私边界存在有一个概念叫“合理隐私期待” ，在1967年凯茨诉联邦案中为解决隐私权的边界问题提出，由于凯茨使用的公共电话亭被联邦官员窃听，凯茨将其告上法庭。美国最高法院认定“保护人民而不是保护场所” ，意思是只要个人的行为意愿并非想要公之于众并刻意避免引起注意，即使发生在公开场合也是可以被保护的。然而这个概念存在有一个致命问题，那就是没人知道“个人的行为意愿”到底是善意还是恶意。正如我前面所举的例子，恐怖分子并非想要公之于众并刻意避免引起注意，这样的隐私该受到保护吗？
我个人的观点是，如果隐私不具有外部性，这种隐私就该受到保护。一旦个人隐私对外界产生不良影响（负外部性），就需要有人来为此负责，产生负外部性的个体应该支付成本使得社会恢复原样，就如同污水治理问题规定污水排放权一样。
然而前面又说了，不确定负外部性来自于谁，只能查看全部个体的隐私来进行搜寻，这种行为反而又造成了另一种负外部性。是否存在有这样的一种技术，对信息查询者的任意问题由机器进行零知识证明验证，从而解决上述难题呢？
对于后一个问题，我认为应由群体选择基本边界，外部性原则确定客观边界，二者并集即为法定隐私边界。而个体可以根据个人选择，在法定边界的基础上自由选择维持隐私还是通过使用私人数据获利。
Q：如何平衡监管与个体权利？
A：恕我愚昧。
Q：如何处理隐私的外部性？
A：区块链技术由“算法+激励机制”驱动，当交易发生在链上时，可以将多个交易方进行划分，同时一组交易中的多个子交易也可根据公共/私人等不同性质进行划分，如果能够明确任意交易中不同节点的归属，就可以由此进行产权划分，解决数据外部性问题。（以上为我胡诌）隐私同样属于数据，但隐私外部性还存在问题，即如何事前预防作恶。
Q：数据的外部性似乎不可避免，我们又如何去为数据确立明晰的产权呢？
A：以上。