疫情下的算力“突围” 绿色计算正为科技企业带来低碳机会( 二 )


算法利用率提升技术发展的核心在于自研 。据了解,蚂蚁集团的所有业务自2019年开始陆续上云,作为服务几亿用户的平台,每分钟都在对海量的数据进行处理和计算,因此蚂蚁集团在追求业务稳定性的同时,也开始系统性地探索绿色计算技术,提高计算资源的利用率、降低服务器数量 。然而,作为提供支付等多种服务的平台,如何在减少服务器用量的同时,保证业务稳定和用户体验不变?如何在绿色计算的同时,维持服务的安全可靠?蚂蚁集团首席技术官倪行军认为,正因为这些困难,逼着我们做出了一些创新” 。
自主研发在绿色计算技术的整体发展进程中占据了重要地位 。在多个技术团队的努力下,蚂蚁集团摸索出一套业内领先的资源调度技术体系,并于2021年双11期间实现首次规模化应用 。据了解,“绿色计算”技术体系来自可信原生、技术风险、OceanBase数据库以及智能引擎等多个技术团队,其中有三个核心技术点:在离线混合部署技术、云原生分时调度、AI弹性容量 。
在离线混合部署可以提高服务器的利用率 。在行业实践中,离线任务和在线任务往往被分布在不同的数据中心,导致了服务器的资源运行效率低且大量的能源浪费 。针对这一问题的解决思路是将二者混合部署在同一数据中心,但技术上面临最大的难点是让在线业务不受离线任务的影响,双方互不干扰 。对此,以蚂蚁集团的实践为参考,将Kata安全容器的强隔离技术用于离线任务与在线任务在调度系统内的混合部署,将在线应用部署到离线集群上面,通过削峰填谷”可以解决资源利用率问题 。简而言之,在交易高峰时,暂时减少对时效性低的离线服务”的处理,将更多计算资源调度至交易结算等“在线服务” 。而到了交易低谷期(比如凌晨)时,再重新开始处理离线服务的计算量 。这种弹性的可自由调度的部署方式是绿色计算技术发展下,值得借鉴的方案之一 。
此外,互联网公司往往每年都要在大量服务器上投入高额成本,那么同一份服务器资源是否可以供给不同时段的业务高峰使用,以提高服务器的利用率?基于云原生的分时调度技术针对这一问题给了确切的回复:可以把一份资源在不同的时间段提供给不同的应用,按照场景需求灵活切分资源供给,确保资源的最大复用和按时足量供给;AI智能容量技术则可以利用大数据和AI技术实现智能预测流量,并进行合理的扩容和缩容 。
【疫情下的算力“突围” 绿色计算正为科技企业带来低碳机会】基于这些创新技术,最终实现的节能效果是“蚂蚁集团的服务器利用率同比三年前可以提高2倍以上,在同等规模的业务下的每一份算力的耗电减少一半” 。
最后,伴随全球互联网的高速发展,数字化程度加深,我们预计未来数据中心的增长将直接带动数据中心的用电量需求激增 。因此,不管是从当下的算力能耗考虑,还是从长远发展眼光来看,通过技术赋能算力节能都是一个正确且必要的方向 。预计绿色计算在算法利用率提升技术发展领域中,一方面将着眼提升算力效率,在物理层面减少服务器数量,间接缓解能耗问题;另一方面将在代码层面加大投入,考虑到大型科技公司每年会生产出数十亿行代码,通过整体提升代码运行的性能,让单位算力的效率最大化将是绿色计算下一步需要探索的方向 。