顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」( 二 )


文章插图

认知智能即「能理解会思考」,需要拥有处理复杂的事实和情形的能力。毫末智行希望通过 MANA 的加持,让自动驾驶超越感知智能的范畴。
此前,绝大多数公司使用的算法源自传统机器人理论,通过规则求解的方式进行决策规划。相比高速公路,城市中的路况会复杂很多倍,只有像人类一样实行决策的系统才能够胜任。
顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图

认知和感知存在显著差别:感知有完全白盒的标准,没有歧义,算法需要利用巨量数据去保证覆盖掉所有特殊情况。认知则没有这样可解释、可量化的,且存在共识的评价标准。
顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图

根据模仿学习算法直接生成驾驶决策。毫末智行在这个方向进行了很多实践,也有了一些收获。
毫末智行提出了认知三要素:安全、舒适与高效,在此之上实现的「基于协同场景安全的认知系统」CSS 包括专家系统和深度学习系统,其决策除了基础规则以外,还参考了从数据中学习到的,其他交通参与者行为的理解和历史经验。
顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图


我们也可以看出,MANA 体系实践了很多深度强化学习。首先定义好得分的目标函数,它是一个概率函数,表征了在某个场景下人类动作和交通规则约束下该做的动作的概率。实践 6 种强化深度学习的算法,发现 RSAC 更适用于不同场景的研究,能够更快收敛,能够得分最高,能够走的更远。

由于舒适与高效很多时候并不能同时顾及,自动驾驶系统会学习驾驶者的风格,从数据中学习不同量化标准。

简单说来就是,你开得更激进还是更稳当,AI 算法在学习了你的风格后会做同样的事,身后还有保证基本安全的规则算法。这才是能够满足大多数人的自动驾驶系统。

顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图

很多人工智能的算法,比如感知的进步需要很多标注的数据。面对大规模量产,尤其要关注这个问题。
毫末要做的是一个高效且闭环的标注系统,把无监督自动标注算法用上。比如车道线识别,目前大部分是通过自动标注完成的。
顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图

我们知道感知对场景非常敏感,光影、强度都会对识别有影响。在自然界中采集,相对就会低效。所以,毫末在仿真系统中生成这些目标图片,然后进行感知和认知的效果验证,效率被大大提高。
顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图

「我们在研究一种端到端的模拟学习,让算法能根据之前的事例作为指导改进本车具体动作,」顾维灏说道。「我认为这是自动驾驶的最佳认知学习方式,因为所有场景都可以被数字化感知,所有的标注都已经在开车的过程中自动完成了。我们需要做的就是挑选更符合要求司机的驾驶行为,在不同场景下持续进行训练。」
模拟学习需要更大的数据样本,特别是标注好的数据。对此,毫末智行提出了基于无监督算法的图像自动标注系统,将图像标注速度提升了几个数量级。
顾维灏|未来三年覆盖100万辆车,毫末智行360T算力之下还有一个「雪湖」
文章插图

未来在智能汽车的推动下,人类记录的数据正在从文本向图像转变,图像的存储和计算规模将占据主导,由此对存储和计算将带来新的革命。据顾维灏在演讲时介绍,用于自动驾驶的数据处理、训练、推理和验证等需求的 MANA 超算中心正在筹备中。