算法|一场泛零售数智化要怎么做?( 四 )


算法|一场泛零售数智化要怎么做?
文章插图
技术风向总在变化,兵贵神速,2016年,包勇军带着团队迅速切入AI框架(TensorFlow)的内核。2017年初,朱小坤入职了,专门负责算法底座,带着团队逢山开道,遇水搭桥。他们的口号可能是八个红漆大字,“稳如泰山”“保障有力”。
2018年左右,京东的GMV(16768亿元),比2013年翻了13倍,业务的压力分分秒秒传导给技术。每当任务激增,资源的消耗必然水涨船高。
这时候,每个人都以为会有好的资源助攻。然而,Paul总提出:“技术能力满足所有团队对于算法和算力的需求,但是,一不能堆人,二不能堆机器。” 听到这句话的人,面部表情恐怕是僵住的。
那一年,AI江湖笃信“计算资源大力出奇迹”。计算资源不够,就好比出去逛街,满世界好东西,兜里钱不够。 那一年,AI算法创新多红利,算法不够,一脸尴尬,这就像出去比武,你拿了一根破木棍,人家打出一套降龙十八掌,顺带九阴真经、弹指神通、六脉神剑…… 王者荣耀打大龙,每一次攻击都在耗血。AI算法跑起来,每秒都在消耗计算资源。
一台很(英)著(伟)名(达)公司的计算设备,动不动就卖到几十万、上百万。高档货这么贵,用起来精打细算,底层物理计算机的资源调度立马提上最高日程了。调度就是一种管理,就是为了用好资源。
想攻下这个“山头”,一连上了好几个八块腹肌、技术勇猛的精神小伙,可惜,皆是铩羽而归。
只要问起,小伙们就满脸不高兴地甩一句:“帅哥的事,你少管。”实际上,底层涉及的技术面比较广,跨多个技术领域。资源调度也是基础设施,在算法底座的下面,是算法底座的油箱。
核心是智慧集群的管理调度,但是,镜像管理、多集群管理、日志管理、监控等每一样都要管好。
有些人一进门,一股杀气。朱小坤一进门,一团和气。朱小坤有了一些白发,但每一根头发都倔强地摆出造型,有一种行事低调的艺术家风范。桌面上总摆着纸质的学术论文,脸上总挂着和蔼可亲的笑容,办公桌前伏案的他,更像大学里一位教高等数学的老教授。
算法|一场泛零售数智化要怎么做?
文章插图
(朱小坤的背影,摄影:谭婧)
618团队统一发的黑色帽衫,看样子是要穿到来年。下班,刷一辆共享单车,路灯下车轮的影子拉得老长。他编程的时候,帽衫上的京东吉祥物Joy似乎也在安静地微笑。 想不到的是,这样一位气质上“宁静致远”的人,别人对他的评价都很激烈,“别人都搞不定,坤哥搞定了”,还有同事说他工作起来动不动就“连夜突击”。
熬夜加班这事,他一听就否认三连,偶尔,偶尔,偶尔。别人想想要上班编程一整天,心痛不已。朱小坤想想要编程一整天,快乐星球。他是有一些功夫在身上的,这个功夫就是“20多年大型计算机系统软件的架构经验”。别人搞不定的事儿,朱小坤带着团队搞定了。
从此以后,资源就不用你争我抢了,有的分配计算密集型的机器,有的分配高存储的机器。人有忙有闲,机器工作节奏也有潮有汐,统一的资源管理平台,大大提高计算机利用率,把计算机压榨到底,节约了不少真金白银。
2018年,一年内,团队将GPU的利用率翻了三倍。连续两年,没有采购任何昂贵的计算机。
计算资源被打服了,而另一个难以攻下的“山头”还一脸傲慢——AI的量(深)体(度)裁(定)衣(制)。
岁月如流迈,春尽秋已至。
从2019年第三季度到2021年第二季度,京东连续八个季度大步增长,活跃用户数增长2000万。以这个体量,想把AI用好,只有以大工程的姿态示人。