数据智能|中国首个数据智能体系发布,毫末智行剑指 2022年「三大战役」( 二 )


数据智能|中国首个数据智能体系发布,毫末智行剑指 2022年「三大战役」
文章插图

另外因习惯差异,不同驾驶员面对同一个场景中会采取不同的处理方式,如果自动驾驶系统的决策无法因人而异,那么将会为不同驾驶习惯的用户带来不良体验。
数据智能|中国首个数据智能体系发布,毫末智行剑指 2022年「三大战役」
文章插图

为了保证产品安全以及道路交通整体安全,毫末智行设计了双推理系统。其中一套推理系统通过场景库内的大量数据学习人类驾驶的规律及方法,进而指导算法迭代。
另一方面,在城市的复杂场景下,人类驾驶规则无法穷举,驾驶风格没有清晰的标准。为了尽可能贴近不同驾驶者的需求,毫末智行将不同驾驶风格数据细分,通过深度学习尽可能实现自动驾驶系统的“千人千面”,提供更舒适的驾驶体验。
通过以上创新,MANA可同时具备对超大数据规模处理、更广泛场景适应性,以及更高的感知认知能力。
数据智能闭环已成道路数据对于自动驾驶公司的重要性不言而喻,但极少公司如毫末智行般投入大量资源构建数据体系。
那么,毫末智行为何如此大费周折?
在毫末智行第三期品牌开放日,顾维灏曾表示,AI 自动驾驶技术的成功依赖于两大关键环节:模型和数据,足够多和足够好的数据是做出好模型的前提。正因如此,毫末智行在过去数月投入大量资源构建自身的数据智能闭环。
所谓数据智能,毫末智行将其解释为数据收集、价值挖掘、价值应用。目前毫末智行已经围绕这三点完成全方位的数据布局。
数据积累方面,毫末智行通过“风车战略”打法,通过大规模的产品落地,从乘用车及末端无人配送车获取大量数据。相较于其它自动驾驶初创公司,毫末智行获取道路数据的成本更为低廉。
具体而言,通过长城汽车旗下大量已售出的量产车型,毫末智行可广泛地收集不同类型的道路数据,且来源稳定可持续,这是毫末智行辅助驾驶系统在极短时间内行程突破400万公里的重要原因。
数据智能|中国首个数据智能体系发布,毫末智行剑指 2022年「三大战役」
文章插图

此外,毫末智行正积极研发末端物流无人车,并将其视为当下自动驾驶技术最易商业化落地的产品之一。从今年4月起先后与美团、阿里达摩院合作至今,毫末智行已量产下线超1000台末端物流无人车。不断提升的末端物流无人车规模,将为毫末智行积累更为丰富的道路数据。
价值挖掘方面,MANA为其中重要一环。
目前,MANA已经将数据感知、认知、标注、仿真、计算等多个环节融为一体,在数据高效利用的同时节省大量成本。
首先,MANA通过明确的系统失效信号,以及更强大的模型进行数据诊断,以便从数亿公里的数据中选取对当前能力有提升的数据。
其次,MANA采用无监督学习将图像向量化为特征向量,通过“谱聚类”将相似的图像聚类。得到聚类结果后,MANA以“是否与问题场景类别相同”作为评判标准,将结果分为正负两种样本,并挑选“类中心”和“类边界”附近的数据提升标注效率。通过此种方式,可以有效提升最终模型的效果。
数据智能|中国首个数据智能体系发布,毫末智行剑指 2022年「三大战役」
文章插图

第三步,MANA将通过双推理系统,对不同空间及时间对数据进行高效挖掘。
最后,MANA采用数据和模型同时并行的混合方案,并优化模型前向计算,可在减少整体显存占用量的同时大幅度提升算法训练的效率。
通过以上四个步骤,MANA可实现高效的价值挖掘。
而价值应用方面,背靠长城汽车这棵大树,毫末智行的解决方案及产品有着毫不缺乏用武之地。