调查:新公链们为何频现宕机事故?( 三 )


此外 , 以太坊二层扩容网络ArbitrumOne曾分别在去年9月14日和今年1月9日出现网络中断现象 , 但从官方公告来看 , 这与流量失控没有直接关系 , 主要还是与该网络由于仍在测试阶段而特意保持的较高中心化程度有关 。
据悉 , ArbitrumOne首次事故的原因是其Sequencer存在bug , 而最近一次掉线则是由于主Sequencer节点出现硬件故障 , 同时备份Sequencer未能及时生效 , 导致网络「罢工」数小时 。
「虽然我们通常有冗余 , 可以让备份Sequencer无缝控制 , 但由于正在进行软件升级 , 这些功能未能生效 。 结果就是 , Sequencer停止处理新事务 。 」OffchainLabs称 。
据悉 , 序列器(Sequencer)是Arbitrum开发团队OffchainLabs运营的一个全节点 。 序列器具有一定特权 , 可控制收件箱中每笔交易的排序 , 来保证用户的交易结果能够立即被确定 。
OffchainLabs在上述公告中表示 , 一旦Arbitrum完全去中心化 , 最有力的保证就会到来 。
03
提高「作恶」门槛是最终解吗?公链稳定性的未来在哪里?
事实上 , 在一定动机激励下 , 编写脚本、「开挂」作弊 , 是互联网用户长期以来的自然行为 , 随着链上交互的增多 , 「交易泛滥」和「机器人」困扰不可避免地会进入区块链空间 。
同期网络运行状态遭遇「恶评」的还有Polygon网络 。 1月初 , 因Polygon上的P2E游戏SunflowerFarmers火爆 , 参与玩家发送了大量事务请求 , 一时间内该款链游的智能合约Gas消耗 , 一度占据了整个Polygon网络的41.8% , 导致Polygon上的其他类型交易被暂时搁置 , 网络呈现高度拥堵状态 , 平均Gas价格数日内上涨近7倍 。
调查:新公链们为何频现宕机事故?
文章图片
Polygon近三个月平均Gas价格走势来源:Polygonscan
Polygon长期为「交易泛滥」所困 , 网络拥堵现象不时发生 。 此前在去年10月 , Poygon已经将节点客户端的最低gas价格调高30倍(由1Gwei调至30Gwei) , 以应对海量的「垃圾交易」 。
这一应对方式与Harmony采取的应急措施一致 。 但调高基础gas价格一方面提高了用户「开挂」的成本 , 另一方面也会给用户体验带来影响 。
对于项目方的这一惯用操作 , 伍鸣对链捕手分析表示 , 调高基础gas作为一种「流控」方式肯定是有效的 , 这一措施的本质是降低了系统所能支撑的吞吐率 。
但他也指出 , 「如果想要做得更好 , 需要在系统本身下功夫 , 提高系统自身能支持的最大吞吐率 , 就会涉及到共识算法、网络转发算法、存储和执行优化等多方面的改进 。 」
Solana联合创始人AnatolyYakovenko披露的「流量控制」改进中 , 就涉及到引入新的协议机制 。 AnatolyYakovenko称 , 新升级中将引入按质押权重的qos流控机制 , 这一机制由「QuicProtocol」实现 , 据称这一协议由谷歌开发 , 已有5-6年的历史 。 通过这一协议 , Solana可以对发件人实施「评级」限制 。
其中 , 如何决定如何在不同的区块之间分配带宽是开发团队最需攻克的命题——这一过程需要验证者接收来自网络其余部分的消息流 , 并根据这些消息的来源权重 , 对服务质量和拥塞控制进行优先级排序 。
AnatolyYakovenko在推特表示 , 上述「流控」措施将在接下来4-5周内推出 。
胡智威则表示 , 对于流量攻击 , 公链还可以采取对于验证人的网络流量保护措施 , 如采用哨兵节点(注:能够在主节点发生故障时通过一系列的机制实现选主从切换 , 实现故障转移的节点) 。 对于TPS更高的解决方案 , 除了在本链进行优化外 , 还可以考虑跨链+应用专有链的扩展处理方式 。