李冬|西安一码通“崩溃”调查:一场系统性失灵的数字政府再思考|钛媒体深度( 三 )


但在后续求证中,阿里云一位发言人直接向钛媒体App否认了上述两个问题,指出云平台遭遇流量拥堵消息失实,这位发言人对钛媒体App回复:“阿里云在西安一码通提供的是云底层设施,没有参与上层的系统搭建。西安疫情期间,阿里云云平台运行稳定,DNS解析和RDS数据库产品也并没有发生故障,我们的技术团队一直在现场重点保障。阿里云十分愿意为西安抗疫贡献更多力量。”
“流量过载,饱和式流量冲到网络防火墙之后,导致流量被拦截,数据请求无法访问数据库,市民信息与后台数据库信息无法比对,最终导致手机端的展示系统无法显示,也就是瘫痪,这个是可以说得通的。”李冬向钛媒体App表示。
据钛媒体App了解,西安“一码通”的网络防火墙产品由启明星辰提供。在一份2020年11月30日发布的“西安市电子政务统一平台网络安全服务外包项目单一来源采购征求意见公示”文件中,采购人为西安市大数据资源管理局,中标金额为392万元人民币,采用单一采购方式,中标方为启明星辰。
李冬|西安一码通“崩溃”调查:一场系统性失灵的数字政府再思考|钛媒体深度
文章插图
西安市电子政务统一平台网络安全服务外包项目合同
问题到这里并没有结束。 钛媒体App了解到,网络防火墙阈值是可以人为调整和设置的,即便一开始在压测时阈值设置较低,收到报警后可由工程师在后台修改调整,并不需要耗费太长时间。“但是从西安一码通的故障修复时间看(第一次故障次日修复,第二次故障约两小时修复),网络防火墙出现问题只是表象。”李冬分析,深层次原因的排查应该在架构设计是否合理,计算、存储和网络带宽资源是否充足,两个大的层面,而从以往经验来看,责任更多在前者。
对此,截至发稿前,钛媒体App再次联系启明星辰,启明星辰回复称,一切以官方信息为准,目前官方信息暂未公布,同时启明星辰也否认防火墙本身出现问题。钛媒体App获悉,启明星辰团队目前在现场积极参与故障的修复。防火墙只是恰好成为故障爆发的弱环,超出设计本身限制。
此外,数字政府项目层层分包(运营商以及大型企业都可以作为总包方,也会互相成为彼此的分包商)也是被外界诟病的一点,这在项目层面属于正常现象。而在西安“一码通”项目中,西安电信作为项目总包,负有验收和把控项目的最终责任。仅西安“一码通”项目就涉及不下十个分包商,更不要说项目规模更大的城市类项目。如何做好分包商产品与服务质量管理,是总包以及项目主体不可推卸的责任,特别是涉及民生的关键基础设施项目。
当汹涌的疫情成为西安“一码通”的新预设条件,这场“违背”预设的系统崩溃似乎也不那么让人意外了。
现有架构应对高并发,力有未逮西安“一码通”的故障与多年前12306春运高峰宕机、双十一狂欢节淘宝与京东的宕机并无二致。不同在于,12306与淘宝、京东的高并发是商业性的,而西安“一码通”故障涉及的是民生问题,出现在疫情防控的紧要关头。
随着数字化、信息化的推进,各种“码”被应用在生活中的各个方面。西安“一码通”这类健康码和微信、支付宝的支付码有相似之处,但支付码却甚少发生大规模宕机事件,两者的对比也有一定参考意义。
与健康码不同,支付码的投入建设周期长,并且从规划之初就采用了支持大规模、高并发的分布式架构,健康码则更多是在疫情期间紧急上马,事急从权,例如西安一码通是在2020年3月到12月数次招标,而在此期间西安一码通已经投入使用,类似情况在全国范围内并不少见。