顾维灏|未来三年覆盖100万辆车，毫末智行360T算力之下还有一个「雪湖」( 二 )

文章插图

认知智能即「能理解会思考」，需要拥有处理复杂的事实和情形的能力。毫末智行希望通过 MANA 的加持，让自动驾驶超越感知智能的范畴。
此前，绝大多数公司使用的算法源自传统机器人理论，通过规则求解的方式进行决策规划。相比高速公路，城市中的路况会复杂很多倍，只有像人类一样实行决策的系统才能够胜任。

文章插图

认知和感知存在显著差别：感知有完全白盒的标准，没有歧义，算法需要利用巨量数据去保证覆盖掉所有特殊情况。认知则没有这样可解释、可量化的，且存在共识的评价标准。

文章插图

根据模仿学习算法直接生成驾驶决策。毫末智行在这个方向进行了很多实践，也有了一些收获。
毫末智行提出了认知三要素：安全、舒适与高效，在此之上实现的「基于协同场景安全的认知系统」CSS 包括专家系统和深度学习系统，其决策除了基础规则以外，还参考了从数据中学习到的，其他交通参与者行为的理解和历史经验。

文章插图

我们也可以看出，MANA 体系实践了很多深度强化学习。首先定义好得分的目标函数，它是一个概率函数，表征了在某个场景下人类动作和交通规则约束下该做的动作的概率。实践 6 种强化深度学习的算法，发现 RSAC 更适用于不同场景的研究，能够更快收敛，能够得分最高，能够走的更远。

由于舒适与高效很多时候并不能同时顾及，自动驾驶系统会学习驾驶者的风格，从数据中学习不同量化标准。

简单说来就是，你开得更激进还是更稳当，AI 算法在学习了你的风格后会做同样的事，身后还有保证基本安全的规则算法。这才是能够满足大多数人的自动驾驶系统。

文章插图

很多人工智能的算法，比如感知的进步需要很多标注的数据。面对大规模量产，尤其要关注这个问题。
毫末要做的是一个高效且闭环的标注系统，把无监督自动标注算法用上。比如车道线识别，目前大部分是通过自动标注完成的。

文章插图

我们知道感知对场景非常敏感，光影、强度都会对识别有影响。在自然界中采集，相对就会低效。所以，毫末在仿真系统中生成这些目标图片，然后进行感知和认知的效果验证，效率被大大提高。

文章插图

「我们在研究一种端到端的模拟学习，让算法能根据之前的事例作为指导改进本车具体动作，」顾维灏说道。「我认为这是自动驾驶的最佳认知学习方式，因为所有场景都可以被数字化感知，所有的标注都已经在开车的过程中自动完成了。我们需要做的就是挑选更符合要求司机的驾驶行为，在不同场景下持续进行训练。」
模拟学习需要更大的数据样本，特别是标注好的数据。对此，毫末智行提出了基于无监督算法的图像自动标注系统，将图像标注速度提升了几个数量级。

文章插图

未来在智能汽车的推动下，人类记录的数据正在从文本向图像转变，图像的存储和计算规模将占据主导，由此对存储和计算将带来新的革命。据顾维灏在演讲时介绍，用于自动驾驶的数据处理、训练、推理和验证等需求的 MANA 超算中心正在筹备中。