Facebook|Facebook宕机事故,暴露了上云不是唯一的答案( 二 )


这两年来 , 上云浪潮如火如荼 , 出现了一些观点 , 认为云服务会彻底消除数据中心 , 但事实上 , 越来越多的企业在尝试让部署数据中心上的旧应用升级 , 而不是将一切业务都云化 。
甚至有企业IT人员告诉我 , 他们可能会让自家的数据中心永远运转下去 。

要知道 , 数据中心几乎占据了企业网络支出的最大组成部分 , 每年需要支付不小的租金和改造、维护费用 , 这无疑会增加额外的成本 , 为什么互联网企业依然坚持这么做呢?
第一 , 传统机房可能会宕机 , 但上云也未必完全稳定 。
云服务虽然不需要维护传统机房 , 数据存储、计算都在云端 , 但几乎没有哪个云服务厂商实现过100%的连续性 , 都出现过计划外的停机 。 2017年 , IBM、AWS、谷歌、苹果等主要云服务提供商也都经历过云中断 , 将Netflix、Quora、Reddit和 Foursquare等热门应用“一波带走” , 影响了大大小小的企业 。
第二 , 成本效益很重要 , 但数据资产安全更重要 。
云服务能够避免维护机房带来的麻烦 , 但除非付费搭建私有云 , 否则依然要与其他云用户共享硬件资源 , 这就使得企业无法对远程硬件拥有足够的控制权 。 任何拥有凭据的人可以从任何有网络连接的地方访问云端数据 , 也意味着广泛的接入点 , 如果不能在每个位置都部署安全措施 , 那么传输的数据风险也很大 。
要论最安全、最可控 , 还是要属自建数据中心 , 只允许拥有凭证和设备的人才能访问本地网络 , 可以让企业完全控制数据 , 以及基础硬件 , 更适合那些业务复杂多元的组织 。
第三 , 多云/混合云有帮助 , 但无法彻底解决顾虑 。
既然这样 , 不把鸡蛋放在一个篮子里 , 一次用两个甚至两个以上的云 , 不就可以在出现故障时快速启动“备胎”吗?道理虽然如此 , 但多云部署的成本很高 , 并且依然不能完全防止短期终中断 , 有时还需要人工参与 , 并不像我们想象的那样能够瞬间丝滑切换 。
比如Gov.uk 就在亚马逊的 CloudFront服务上运行了备份 CDN ,但需要人工干预才能切换到备份 。

而适合建设云基础设施的环境也常常会出现扎堆的情况 , 从而导致几家云服务商要停机就一起停的尴尬 。 此前 , 亚马逊和微软在爱尔兰都柏林的云基础设施 , 就因为遭遇雷暴天气 , 让使用亚马逊EC2和微软BPOS服务的客户都宕机了 。
另外 , 并不是所有的云都是完全开放、可互操作的 , 这时候为了用好每一个云平台 , 企业还需要通过多个系统来配合 , 增加了额外的支出和运维难题 。
所以说 , 只有足够可靠的云服务 , 才能打消客户的顾虑 , 从本地容灾备份、混合云等其他方案 , 转变为全面依赖云 , 并且只依赖某一朵云 。
当许多人呼吁着 , 把云看作万能神药的时候 , 必须考虑一个前提:云服务怎样才能变得足够稳定和安全?而这一点 , 似乎跟现实还有点距离 。
安全力Max:Facebook的冗余启示录
归根结底 , 想要业务更可靠 , 每个组织都没有“一刀切”的解决方案 。
公共云、私有云、混合云或传统数据中心 , 如何选择应该按照不同企业、不同数据隐私敏感度、成本预算等来综合考量 。
简单来说 , 传统数据中心成本高 , 控制强 , 很适合那些已经在IT方面进行了大量投资 , 对数据隐私要求谨慎的组织 , 所以像Facebook这样涉及到全球几十亿用户信息的互联网企业 , 数据中心是必须配置的 。
而大多数企业 , 完全没有必要自己搭建服务器 。 直接上云省心又省力 , 可以快速搭建起网络业务 , 但过程中必须对隐私访问进行密切监控 。