把腾讯搬到云上,治愈了他们的技术焦虑( 三 )


云原生上云促使云支撑环境跟公司的开发环境完全打通 , 整个开发流程都发生了变化 , 一切面向手工的工作 , 变成面向API的工作 , 从手工时代进入了自动化时代 。 之前研发需要自己去购买和部署物理机、虚拟机 , 扩缩容需要再买机器、再部署 , 现在已全部自动化、DevOps化了 。
经此一役 , 如醍醐灌顶 , 于广游从一个纯粹的技术原教旨主义者转变为一个更求真务实的人 , 对云技术演进的思考开始慢慢加深——任何一个云产品不单要给用户提供直接的使用价值 , 它更核心的演进方向是如何降低企业的上手门槛与迁移成本、如何让更多的企业在更多的场景用起来 , 也即从一个听起来很高大上的技术变成我们每个人都用得起来的、实实在在的身边的技术 。自研上云 , “治愈”技术焦虑
把腾讯搬到云上,治愈了他们的技术焦虑
文章图片
腾讯课堂研发中心负责人王昂“抛开QQ的光环 , 我们还有什么?”
多年以前 , 每参加一次外部的前沿技术分享 , 年轻的QQ后台开发工程师王昂 , 就在心里拷问自己一次 。
那是他2013年毕业后进入腾讯的头几年 , QQ上线十余年 , 月活超过8亿 , 如日中天 。
而在业务这一庞然大物之下 , 王昂日日夜夜面对的技术架构体系 , 正在被外部先进的技术理念拉开距离 。 假以时日 , 这套技术架构必然会和前沿技术脱轨 。 而他本人包括他所在的团队 , 也将被淹没在技术浪潮之中 。
现实对他的失落报以冷漠 。 这套QQ的技术架构稳定地屹立在他面前 , 而且表现优异 , 它依然可以撑起高企的并发流量 , 依然可以撑起日益复杂的业务需求 , 毫无萎靡的迹象 。
只是 , 外面明明还有更好的技术架构理念 , 有更好的开源组件 , 有更饱满的精神世界 。
怀揣“可望不可及”的焦虑感 , 王昂迎来2018年 。 腾讯在这一年进行“930变革”后开始摸索自研业务上云 , CSIG(云与智慧产业事业群)成立后 , 他所在的团队也被划入其中 , 开始做教育相关的产品 , 其中就包括知名的综合性在线学习平台腾讯课堂 。
老团队 , 新业务 。 “这套技术架构体系怎么搭建?”团队每个人心中都泛起了涟漪 , “省点儿力气 , 继续沿用QQ成熟稳定的老技术栈?还是向落后的自己告别 , 靠向腾讯云的新技术栈?”
选择难而正确的路需要勇气 , 王昂坦言 。 从实用主义角度来看 , 老技术栈依然能用 , 而且足够稳定 , 不会对业务造成影响 。 如果向新技术栈靠拢 , 学习成本、工作量将会大幅增加 , 不仅会牺牲日常产出 , 甚至会因为组件不够成熟而被业务挑战 。
没有人愿意选择止步不前 , 犹豫、纠结没有持续太久 。 不过业务的挑战也如约而至 。 在切云上新技术栈过程里 , 有一次腾讯课堂的很多用户评论出现乱码展示 , 在被业务挑战后 , 王昂团队马不停蹄地连日定位 , 最终发现是云上跟云下的数据库某一个配置没有对齐 。
不过 , 王昂他们没有成为惊弓之鸟 。 于是我们看到这样一番景象:为了不因业务挑战而中断技术栈的“移髓换骨” , 王昂他们小心翼翼地抠所有的细节 , 用更长的时间做灰度测试 , 在一个容器、一个Pod网络不稳定的情况下 , 去反复做前端的重试和容灾 , 在前期使用云数据库组件的时候 , 为防万一他们会多加一些缓存的Redis的Catch……
当然在上云的过程中 , 王昂和团队不是孤军奋战 。 就上云组件的细节 , 他们和腾讯云的产品部门进行了大量磨合 , 一年下来共同解决了近400个问题 , 双方就容器、运维、音视频等组件进行了持续交流 , 既完善了腾讯云的技术栈 , 也保障了腾讯课堂的上云过程 。