攻击|华为云春节前夕遭连续偷袭!密谋3个月,专挑凌晨断网

杨净 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
“把上海、广州两个站点网络全断掉!”
“趁他们晚饭不注意的时候,注入攻击!”
“还要在凌晨3点大家睡觉的时候,再攻击一波!”
……
这是华为云最近破获的一次“阴谋”,时间就在春节前夕。
之所以这波攻击不容小觑,是因为如果阴谋一旦得逞,华为云内部系统的运行将面临严重的后果。
攻击|华为云春节前夕遭连续偷袭!密谋3个月,专挑凌晨断网
文章插图
1个月发动组合攻击20余次攻击者的计划,在3个月前就已经开始。
经过密谋协商,他们决定在春节前后“干票大的”,近1个月来发动组合攻击20余次。
动机很简单:春节期间,各种短视频、社交媒体,包括自拍软件等应用流量激增,理论上是多数云服务厂商流量最高、最易出故障的时候。
一旦攻击成功,就会有大量互联网服务出现不稳定、甚至影响更大的情况。
尤其像除夕抢红包这类活动,8点到凌晨1点正是流量峰值期,故障多一秒钟用户都无法忍受。
所幸,这次攻击结果并未达到目的。
华为云反应非常迅速,将排查问题的时间限制在3分钟内、并利用5分钟进行修复,最终在8分钟内就处理好了系统故障,全程没有影响到云上业务的运行。
不免让人好奇,为何华为云会任由这些攻击反复发动?
毕竟对于华为云来说,这群攻击者已经不是“初次来犯”。
手段从人为攻击到利用系统“自动”攻击,类型从断网、故障注入到各种最新的攻击“武器”,都被他们尝试过。
但即使面对未知攻击,华为云却依旧能迅速处理。
不止这类春节前夕的攻击,面对各种类型的攻击,他们都能及时察觉系统异常、迅速定位并解决问题,将整个过程压缩到10分钟内。
而这又是为何?
随时待命的“特战队”原来,这个秘密谋划三个月、攻击华为云上千次的攻击者团队,竟是华为云内部的一支“秘密团队”,名曰“蓝军”。
他们不停地设计最新的攻击弹药,随时对华为云系统进行突袭。
至于作为防御方的红军团队,则是随时处于待命状态,一旦察觉蓝军攻击便第一时间进行修复。
攻击|华为云春节前夕遭连续偷袭!密谋3个月,专挑凌晨断网
文章插图
两个团队之间没有任何沟通,什么时候触发攻击也不可知。
除了人为攻击,蓝军甚至还用上了混沌工程,系统会随机、自动地去攻击红军维护的系统,近一年攻击总数多达2000+次。
而在这类攻击背后,所有的动作都只有一个目的——
提升华为云系统的稳定性和应急能力。
即使在春节,系统的维护和防御也不会停止:华为云专门成立了一支“特战队”。
“特战队”的规模上百人,都是已经应对过无数次攻击、“身经百战”的全栈工程师。
从现在一直到元宵节,“特战队”队员们按三班倒的形式,7×24小时全职投入春节运维保障。
这样一来,即使攻击者想“趁虚而入”,从流程上来说也不会太过轻松。
但这还仅仅是解答了第一个疑问。
为何华为云面临攻击,能迅速稳定地处理整个流程?
故障率保持在0.01%以内可以说,这次蓝军的攻击,正好撞在了早有准备的红军“枪口”上。
早在三个月前也就是11月5日,红军就已经开始排查系统风险,并通过流量预估来进一步降低故障发生率。
事实上,这已经不是传统意义上的运维团队了。
无论是日常排除风险故障、维持系统稳定的红军,还是春节值守的“特战队”,都来自华为云内部一只“训练有素”的团队——SRE。