算法|一场泛零售数智化要怎么做?( 二 )


时间往往是最大的敌人,实时性是最难的问题。虽然难,但是业务很受益。所以,京东零售对实时性的要求十分之苛刻。 世人常说,昨天之不可能,今日之极限,明日之平常。在推荐系统(召回过程)里,2020年做到了30分钟级的实时性,2021年做到了1分钟级别。 那么问题来了,如何办到的?
这得从一个人谈起。他就是现任京东集团副总裁、京东零售技术委员会主席、京东零售技术与数据中心负责人、京东零售云总裁颜伟鹏。
在来京东之前,他曾担任谷歌中国工程研究院副院长,英文名字是Paul,发音简短上口,所以,大家日常称呼,Paul总。2013年,Paul总初到京东,看到这样一番景象,场景多,需求多,研发团队忙得脚打后脑勺。谈创新?谁也顾不上。Paul总说,这样不行,京东研发体系是采销体系的坚强后盾。他在一张神秘蓝图的留白处,批了八个字:标准、自动、规范、智能。
02 最骚操作追溯八年时光,再看烟火热闹。 那些年,虽然生意亮眼,但是技术欠些火候。Paul总在谷歌公司的时候,曾经穿越谷歌与必应搜索世纪大战的硝烟,战绩斐然。在他心里,无论业务是什么,技术实力要对标硅谷。
顶尖人才需要愿景驱动。于是,Paul总用这张神秘蓝图招揽人才。 2014年春,Paul总面试了一位年轻人,包勇军,他身形挺拔清瘦,对技术的热情像白色水蒸气一样往外冒,简历里写满全球顶尖项目,反而很少有人提他是北京大学毕业的。据说,包勇军看过那张神秘蓝图后,转身就入职了,带广告算法团队。 有一件事,大家都知道。
Paul总倾听汇报的时候,要么不说话,要么只问一个问题便能抓住要害。而那些从Paul总办公室里结束汇报,走出来的算法工程师,心底都只有一句话:“你哪里有问题,他一眼就能看穿。” 另一件事,只有几位专业的博士同事才知道。
语音识别是典型的人工智能赛道,在语音识别技术试水初期,一个小众语音识别工具需要选型,多位资深专家举旗不定。Paul总亲自参加多场选型会后,定下了结果(kaldi )。一段时间后,其中一名研发人员机缘巧合地请教了一家科研院所专攻此方向的教授,吃惊地发现教授实验室的同方向的组里也用同款工具。想不通Paul总是怎么定下来的。
Paul总的身上,没有时差,一直过着中美两个时区,电话会议开到深夜,一觉睡醒,京东ME里总有Paul总的指导性留言。次日清晨的技术选型会上,又见Paul总的身影。 团队在Paul总的领导下,避大坑,绕雷区,躲弹片,不恋战,从不为了技术而技术。只为速穿火线,荡平山头,拥兵破阵,策应业务,用技术驱动零售。
时光流转,代码质量被史无前例地提升,技术在业务场景里加速创新。Paul总当初定下的目标没有变,标准、自动、规范、智能。想做到这几点,绝对少不了一个强大的算法底座。算法和算法底座虽为两件事,但又密不可分,刚柔并济。干的活完全不同,还又要彼此理解。
一般来说,一个业务场景,由一个算法团队负责,一个算法底座团队来打配合。表面合理,本质错误。若是日后业务场景里的算法数量翻10倍,算法底座团队数量是不是也翻10倍?一路放任,无法无天。
这打法又俗称“堆人战术”,明显是错的,来一个工单,堆一波人。这就好比下雪了,派人扫雪,下大雪了,派更多的人扫雪。可是效率呢?技术研发很少讲绝对,但是“研发人效低了”绝对不行。 认错很难,尤其是错了很久之后。所以,早期判断,弥足珍贵。
包勇军是怎么干的呢?他把队伍分成两路,上路纵队专攻算法,下路纵队专攻算法底座。上路猛冲狠打,下路火线支援。算法冲锋,算法底座支援。战场上,增援和冲锋同样重要。否则一味冲锋,孤军惜败。