科学家|在阿里「死磕」自动驾驶,一个应用型AI科学家「命中注定」的故事( 三 )


看起来,阿里非常契合王刚的需求。而且阿里是一个足够大的舞台,能够让他尽情施展拳脚。
不过,王刚加入阿里人工智能实验室后,并非一把上自动驾驶,而是临危受命接过了天猫精灵的研发担子。
根据他当时的观察,人工智能产品在云上的应用已有许多案例,如人脸识别、语言识别等。但是端方面,还是一个相对空白的市场。
而且终端产品需要考虑到场景、计算等多方面的制约,挑战性更大,是为自己打开工业界入口的好机会。
几个月后,王刚和团队一起研发出了初代猫精「天猫精灵 X1」,天猫精灵正式从 demo 走向可以交付的量产产品,并且很快就成了出货百万的爆款。
眼看天猫精灵的发展越来越好,就在这时,王刚又做了一个出人意料的决定——主动请缨,带领团队从 0 到 1 做自动驾驶。
“这个事情是值得做的,它属于技术应用的第一象限,既有社会价值也有商业价值。”王刚解释道。
而他的这个决定,也获得了阿里高层的支持和重视。
2017 年 10 月,NASA 计划的实体承载组织达摩院正式亮相,其中就下设了自动驾驶实验室,随后由王刚担任掌舵人。
最初,由于没有合适的场地,王刚就带着几个小伙伴在西溪园区的车库边上进行简单改建,然后开始买车、改装、路测。
这段车库「创业」的历程,就是小蛮驴的源起。
尽管进入工业界之后的一切都还算顺利,但王刚也坦言,以前做的前沿研究很多都没有用武之地了,他更多的还是给团队上带来思维上的转变。
比如,无论是做 NLP 还是做视觉,无论是做天猫精灵还是小蛮驴,团队都要思考两个问题:
一个是怎么获取场景数据,一个是怎么用好这些数据。
据王刚分享,他刚接手天猫精灵时发现语料短缺问题比较严重,这会直接拖慢产品化的进度,但由于还未形成产品,很难从用户处获取语料;相当于陷入了一个矛盾的困境。
为了解决这个问题,王刚提议花钱找志愿者编辑语料,试图通过这种方式来弄明白用户与智能音箱交互的喜好,然后再把这些语料收集起来,用于算法训练。
另一方面王刚发现,很多工程师小伙伴习惯使用最前沿的技术去解决最简单的问题。
比如,智能音箱经常会接到开灯关灯的指令。
由于定向思维,很多工程师会让智能音箱应用自然语言理解技术去理解开灯关灯这样的短语。但王刚认为这是一个非常朴素的问题,写一个规则就能轻松解决。
自动驾驶也是如此。
起步做自动驾驶时,阿里一直是以乘用车作为实验平台来跑算法,当时并没有明确的产品方向。在宣布进军末端物流赛道后,难免引起了团队里一些同学的心理落差。
不过,王刚坚信末端物流是一个正确的战略选择:
技术人员都希望做看起来更有挑战事情(比如 Robotaxi),这种对待技术的态度应该鼓励,但大家有时候可能被外面的噪音给干扰了。
他进一步说道,自动驾驶系统无疑需要数据驱动,如果只有几百辆测试车,数据量够不够支撑公开道路上完全无人驾驶的实现?答案是否定的,而且也没有任何一家公司能够负担起几万、几十万辆路测车所需的资金。
与此同时,国内末端物流未来的市场规模预计会超过 300 万台,市场需求是有的。
基于这样的思考,阿里选择先找到一个垂直产品落地,然后再通过这个产品产生价值、推动业务发展,从而实现规模化并且学习更多的场景知识。
而末端物流与阿里业务生态是完美吻合的,落地场景无须担心。
开启大小蛮驴时代
事实上,阿里自动驾驶实验室很少对外发声,王刚也不喜出风头。