阿里云|阿里巴巴CTO独家自述:CTO就是要给CEO扫清障碍和风险( 五 )


我到了阿里巴巴之后,第一件事情也是需要大家聚在一起,一起定下目标。空降到一个平台,其实很难给团队定一个全新的愿景。如果新CTO上来就先画一张未来的图,基本是不太靠谱的,还是要和团队一起定下非常扎实的目标、一起达成目标。于是,我选择先在云这个关键战略上稳中有进,全面上云必须全部完成。二是在云之上,如何从“上云”到“用云”,把云原生做深入,将阿里巴巴中台做深入,包括AI中台、数据中台和业务中台。另外一个目标是组织数字化,阿里巴巴虽然生于数字时代,但也需要做数字化升级和转型,阿里巴巴数字原生商业系统和数字原生组织是去年和团队一起确定的方向。
CTO和团队在一起要有一个面向未来的思考,不只是当下与业务的连接。未来是什么,关键的路径是什么,核心的几场仗是什么,这是CTO的牵引力。
3.关键决策,扫清前进中的障碍
CTO需要帮团队解决问题,扫清一些障碍,做出一些关键的决策。在蚂蚁做CTO时,第一个关键的决策是技术架构往金融方向还是互联网方向?最后决策是互联网。第二个关键决策是关于OceanBase的转型。
2010年,阳振坤老师带着团队开始打造OceanBase。最早OceanBase还不是一个真正的数据库,当时第一个场景是解决淘宝的收藏夹问题,需要海量数据但不需要很强的数据处理能力。但到了2012年,OceanBase面临一个发展决策,要不要成为一个真正的数据库。
蚂蚁团队对OceanBase的怀疑有合理的理由,我们现在的业务对数据库要求这么高,Oracle那么先进的数据库团队打造了几十年,才刚刚能满足我们的业务需求。阳老师带着几十个人花两年时间打造一个数据库,能把Oracle替代掉吗?
我觉得王坚博士是很有领导艺术的,当时他做了一个选择,他说:“把OceanBase送给支付宝吧。”到了蚂蚁这边就成了我当时定的“1234目标”中“2”的部分:看OceanBase能不能再往前发展。
当时我们采用了什么办法呢?第一先了解清楚OceanBase能干什么;第二,既然公司整体不能做,就搞一个小场景,在蚂蚁的核心交易里切了1%的流量给OceanBase,让它在1%流量里证明能力。OceanBase也很珍惜这个舞台,撑住了1%的流量,最终在这一年完成了从非关系型数据库向真正关系型数据库的转变。2014年我们再大胆往前迈一步,把“双11”大促10%的流量切给它,让它进核心账务系统——账务系统比核心交易系统要求更高。当时这个决策是有一些冒险的,但现在回头看,正是这些决策让OceanBase有了不一样的未来。
后面几个决策也类似,作为CTO如何拿捏好风险和稳定,是非常关键的。
比如余额宝上线的第一天我们就知道这个产品一定会成功,因为它的客户价值特别清晰,让用户每一块钱的余额都有收益。但我们没有料到,它成功得那么快,一个月时间迅速就把原来准备的系统容量全部用掉了。我们自己还好,因为蚂蚁的平台已经完全分布式化了,可以快速扩容。但我们的合作伙伴天弘基金,因为老系统无法支撑余额宝这么快速的增长,扩容成了核心难题。
于是我们做了一个非常重要的决定:把天弘的系统搬到云上,用分布式架构重写一遍,三个月内必须完成。这件事也证明了金融云的价值,金融云的业务也就起来了。
这些都说明,CTO要在关键决策中发挥作用,帮助团队下决心并把握好不确定性。
4.应对风险,化危为机
公司的技术风险有几类。
第一类,技术架构不能够支持业务发展,这是业务不能接受的风险。但这类的风险,相对显而易见。阿里巴巴为什么在2009年启动“去IOE”,就是判断到这个风险早晚会出现,“IOE”架构已经不能支持公司业务发展,必须去掉。蚂蚁在2010年开始启动“去IOE”,因为那一年“双11”大促让我们看到原来架构基本不能支持业务了。