阿里巴巴|被你质疑价值的混沌工程,阿里巴巴已落地实践了9年( 三 )


相辅相成的混沌工程和云原生 经过多年的发展 , 目前从技术的角度 , 行业内已经有了一些通用的混沌工程实验解决方案供企业选择 。 可以看到的是 , 混沌工程的实验和云密切相关 。 随着云服务渗透到各行各业 , 逐渐发展成为新的行业基础设施 , 对云服务的韧性提出了更高要求 , 而混沌工程被验证可以有效检验云原生系统的韧性架构 。
“韧性架构的前提是先要对架构有一个理解 , 不管是 Java 语言体系 , 还是 GO 语言体系 , 阿里云帮助客户做的第一件事是搭建整个架构 , 第二件事是尝试把内部发生过的故障、在行业看到的故障 , 以专家经验的方式固化在平台中 , 结合架构做针对性演练方案的推荐 。 当企业把这些场景都验收 , 企业系统的韧性就达到了一定的水平 。 ”中亭谈道 。
在企业上云早期 , 可以在上云前后的平行环境下 , 针对性地做混沌工程场景实验 , 观测整个架构的反应是否一致 , 进而为企业使用云服务、考量架构的容灾能力提供可判断的依据 。 在企业上云后 , 混沌工程实验可以帮助运维工程师检验云服务 。 中亭解释道:“大家会关注用云姿势是否正确 , 比如说容器中间件 , 来去看企业是不是按照云的最佳实践 。 ”
无可讳言 , 对于混沌工程的价值 , 目前在业内还没有一个明确的度量标准 , 但是可以通过简单的例子来有效佐证 。 据中亭介绍 , 一方面可以先选定一个场景 , 从结果上看 , 混沌工程可以保证场景不劣化;另一方面 , 如果度量组织进行突袭 , 不管系统架构和人员架构怎么变 , 监控结果都在合理的范围内 。 总体而言 , 混沌工程的核心就是增强信心 , 保证系统在某个场景下的能力不退化 。 只要这个组织有度量“特定场景下能力是否退化”的指标 , 混沌工程的价值就显而易见了 。
作者丨张俊宝
本文为阿里云原创内容 , 未经允许不得转载 。