运维|千亿运维的智能革命,下一个头部玩家在哪里?( 二 )


观察二:数字化转型的持续深入带来运维难度指数级增加。
云计算、大数据、SDX等新一代信息技术的出现和发展颠覆了传统IT架构,IT运维的内容和管理模式也随之出现巨大变化。IT运维的业务人员的工作边界从原来关注机房环境管理、设备巡检、设备告警等物理硬件运维拓展到了应用运维、安全运维、开发运维等领域。
2015年的时候,一家约500人的企业可能也就只有OA、ERP、CRM等十几套系统,但现在,一家同等规模企业可能需要五十套业务系统。IT基础设施也不再是服务器、存储、网络的标准三件套,而是从公有云、私有云、混合云囊括到传统的IT硬件,甚至IBM小型机等啥都有的大杂烩。
以上,运维复杂程度的提升不是线性增长,而是指数级增长。
业务上每出现一个响应延时,就可能会带来几千个关联告警。同时,查找响应延时根因的链路也变得非常长,这早就不是多招点运维人员就能解决的问题了。
占运维总市场规模超50%的第三方运维服务市场,原先也以人力外包驻场服务为主。然而,在运维难度指数级提高后,原有的大规模初级运维人员所具备的技术栈已很难胜任新一代IT架构的运维需求。
观察三:逐年上升的人力成本和繁杂的IT系统建设间的矛盾。
从美国的IT发展历程中,我们可以看到一部美国IT工程师人力资本的变迁史。当企业的IT需求增速远远超过IT人才培养的增速时,美国企业的IT就经历了从In-house IT,到IT外包的发展,再到产品化软件以及现在估值已上天的SaaS模式。
这一发展过程的底层逻辑是社会的IT人力资本相对于IT需求的爆发逐步稀缺,于是,企业们经历了从各家养团队啥都自己开发,到外包出去交给专业软件公司去开发,再到现在SaaS模式下的开发一套软件全社会共享使用的过程。
笔者不敢妄言当下国内的工程师红利正在衰退,但IT工程师的成本变得越来越贵已是不争的事实。此外,由于运维业务在大多数客户组织体系中的价值彰显度不高,愿意做运维的专业优秀人才越来越少,也越来越难招。对指数级增长的IT运维需求,通过扩张人力来支撑显然力不从心。
另一方面,运维行业的一项核心能力是IT运维经验知识的积累。老师傅见过世面,看到一个告警就能大概知道是服务器问题还是网络问题,而新手即使熟读全部告警和日志也不一定能抓得住重点。奈何短期市场上的老师傅就这么多,新一代“老师傅”的成长周期太长,同样无法满足当下爆发式增长的运维需求。
因此,这个场景相比于“从监控视频中识别出员工有没有打瞌睡”更适合人工智能去落地,于是就有了这几年如火如荼的AIOps—智能化运维。通过AI算法将运维过程中的经验、知识沉淀成一个个模型,起码能够帮助运维新手们了解最重要的几十个告警,提示故障出现的可能因素以及解决方法,大幅减少工作量。
当下运维服务市场大多由原厂维保和人力运维外包构成,可以预见的是未来原厂维修的比重将持续下降,人力运维成本持续走高,市场会将客户需求推向具有智能化运维能力的软件厂商。当以人力为主的IT运维市场逐步迁移到技术平台主导的智能运维市场,原来分散的运维市场将会出现一批头部玩家。
到底什么样的软件公司才能够在市场变革的过程中拿下蛋糕?作为企业服务投资人,一般都会先看看海外市场主流玩家们的成长历程。
02他山之石:Servicenow向上,Datadog向下美国的IT运维长期来看一直是大赛道,容纳了不下十家不同类型的上市公司。其中最具典型特征的企业有两家,一个是运维赛道中市值最高,超过1200亿美金的Servicenow;另一个是赛道中PS(TTM)倍数最高,超过60倍的Datadog。