利益网络|揭底Filecoin利益网络:无法存储的“存储革命”( 三 )

Filecoin并不负责处理数据的存储。数据是在一个存储用户和一个存储矿工之间1对1以非常中心化的方式存储的,双方都同意采用Filecoin来完成支付、合同约束(包括心跳监测)。
利益网络|揭底Filecoin利益网络:无法存储的“存储革命”
文章插图
图:Filecoin官方团队表示,他们注重提供极简功能,纠错、故障域隔离等功能应该在Filecoin之外实现。关于重建功能,他们在2017年写白皮书时考虑过该功能,但因为与激励机制不兼容而没有去实现。
因此, Filecoin无法保证矿工提供存储服务的质量。商业数据当然也不会选择Filecoin。
“无论从商业存储、技术或公共存储角度来说,任何有价值的数据都不应该存储在这样一个没有保障的网络上。”一位存储专家对链得得App说。
无法保障的数据安全事实上,Filecoin对数据损坏、存储节点掉线等问题采取的唯一解决方案是,寄希望于矿工对数据进行了备份。按照Filecoin团队在社区问答中的回复,Filecoin会惩罚丢失数据的矿工。
具体来说,Filecoin的惩罚机制是:
矿工发现扇区故障并主动报告,将被扣除该扇区预期2.14天收益;
矿工没有发现而被系统发现扇区故障,则将被处罚该故障扇区3.5天收益作为扇区错误检测费;
如果在扇区到期之前终止扇区,则前期该扇区获得的部分区块奖励将被一并扣除(≤140天,没收一半服务时间的收益;>140天,将没收70天的收益)。
这种惩罚算得上是严厉。Filecoin团队无疑是以此强制矿工对数据进行备份。
这种方式是否有效呢?一位工程师在接受采访时为链得得App算了一笔帐:“Filecoin矿机存储的成本非常高,随着时间增长,存储成本会越来越高,甚至超过计算成本。如果每天产生200GB数据,一年会产生73TB数据。按照目前的市场价格(采访当时),硬盘的单价大概是2万人民币左右。这意味着当接近硬盘存储上限时,矿工应当放弃对数据进行多副本备份,转而利用纠删码对数据进行冗余。”
多副本和纠删码都是对数据进行冗余备份的手段。多副本是指将数据复制多份分别存储,当其中一份数据出现问题,就利用其它复制进行修复。纠删码则是将完整数据分成多个数据块,其中一个出现问题时可以利用其它数据块进行计算,将数据补完。
上述提到的存储技术专家告诉链得得App,纠删码的可靠性是远远高于多副本的,例如128+36(即数据分成164块,只要有128块就可以恢复数据)的纠删码虽然数据冗余率只有约130%,但可靠性远远高于10副本(冗余率1000%),更别说常规的3副本。只是实现基于纠删码的存储系统技术难度比较大,Filecoin的代码中并未体现出协议实验室能够解决纠删码的技术能力。
中山大学数据科学与计算机学院教授刘芳认为,在大规模网络中,设备的存储能力常常是异构的,需要考虑小容量设备的存储能力。低空间开销的区块链存储系统,有利于区块链部署到大规模异构网络中,适应更多类型的系统与场景。虽然Filecoin在白皮书中表示,将采用纠删码的数据冗余方式,可以一定程度上降低存储空间开销,然而,纠删码与区块链技术结合的工作尚不够完善。关于纠删码节点的比例、节点容量溢出、编码系数设置和区块同步等问题亟待解决。
实际上,在商业存储市场上,保障数据安全是无法仅仅通过纠删码来实现的。在一个成熟的存储系统当中,数据冗余、故障域隔离、心跳监测、故障数据重建等功能都非常重要,Filecoin在这些能力上的缺失决定了其所宣称的“储存人类社会最重要的信息”仅仅是一个空中楼阁。