Apollo Lite 3周年 百度野心终现

作为机器学习的明珠 , 智能驾驶的演进从科幻的遐想转眼已进入产品的近身「肉搏」 。 前有Robotaxi多传感器融合路线的L4无人车公司的狂奔 , 也有特斯拉为首的视觉技术路线追捧者 , 后有国内纷纷兴起的智能汽车大军 。 针对能否将L4级技术降维赋能到乘用车 , 达到类似L4的体验并实现科技普惠 , 市场一直未有“头绪” 。 而正值百度ApolloLite3周年 , 市场似乎有了一个新的答案 。
一、“抛弃激光雷达”ApolloLite是什么?
当前市场划分有两大技术路线 , 第一条是基于Robotaxi无人车代表队 , 利用高性能传感器以及高阶算法 , 在特定区域内做商业化运营 。 而另一代表是车企 , 普遍采用渐进式技术路线 。 但存在的难题是场景数量级太大 , 海量数据的挖掘和有效流转是较难攻克的难题 。 并且乘用车智能驾驶应用的场景比限定区域更加广泛 , 非常多的不规则长尾场景问题需要解决 。 在短时间内 , 完全的自动驾驶落地仍需要很长一段路要走 。 而在与车企合作的过程中 , 百度也面临智能驾驶技术落地的难题 。 如何以L4级自动驾驶技术降维应用到L2级城市辅助驾驶?百度Apollolite顺势而来 。 ApolloLite是采用纯视觉感知 , 不依赖激光雷达的自动驾驶技术路线 。 ApolloLite技术的具体落地成果有两个 , 其一是百度Robotaxi降本增效 , 另一个是百度ANP城市领航辅助驾驶产品 , 面向车企客户 , 提供量产解决方案 。 ANP和自主代客泊车AVP , 后面两者实现了L4能力的降维商用 。 我们可以理解为 , ApolloLite是百度ANP、AVP背后的技术路径 , 类似于小鹏当前多传感器融合技术路线或者是特斯拉主打的纯视觉技术方案 , 而它们各自落地的产品比如小鹏的高速NGP、城市NGP , 以及特斯拉的NOA等等 。
Apollo Lite 3周年 百度野心终现
文章图片
有趣的是 , 在激光雷达开启军备竞赛之初 , 百度又为何坚持发展视觉技术方案呢?百度认为激光雷达和摄像头不是排它的 , 也不是单纯的从属或互补关系 。 所以在自动驾驶研发过程中 , 百度内部保留了两者的第一性 。 由于不同型号激光雷达所产生的感知数据结构不尽相同 , 所以激光雷达方案会给算法迭代带来挑战 。 加之高线束激光雷达本身的技术发展、成本居高不下 , 也限制了激光雷达自动驾驶方案的大规模量产应用 。 大力发展纯视觉路线还有另一大原因 , 就是百度背靠Robotaxi高级别自动驾驶经验的积累 , 在视觉算法、专业测试数据、仿真平台以及地图配套都能发挥独有优势 。 另外纯视觉方案的“包袱”更轻 , 更适用于车企量产 , 例如传感器、算力优化、车规级计算平台等 , 相较于激光雷达的方案成本更低 。 同时在用户体验的优化上更为敏捷和灵活 。 三周年之际 , ApolloLite迎来了产品化的关键节点 。
二、技术降维ANP领航辅助驾驶继承强视觉血统
对车企而言 , 百度ANP的产品优势 , 则是利用了ApolloLite纯视觉方案以及Robotaxi技术降维 , 来满足乘用车城市辅助驾驶量产需求 。 既要达到接近L4级Robotaxi的体验 , 又要做到“轻”传感器、“轻”算力、强视觉感知 , 从而符合车企不同价位车型量产需求的产品方案 , 这对于当前主流技术来讲 , 似乎是一对矛盾关系 。
Apollo Lite 3周年 百度野心终现
文章图片
Apollo Lite 3周年 百度野心终现】ANP的落地是否现实呢?我们围绕ANP的落地 , 也就是视觉方案以及降维的难点进一步分析 。
疑问一:如何解决纯视觉方案的难点?
我们看到 , ANP产品集成了12个摄像头、5个毫米波雷达、12个超声波雷达达到360度环视感知 , 200帧/秒数据量的并行处理 , 能够对城市道路场景下的红绿灯识别、环岛绕行、进出主辅路等驾驶场景完成识别、规划、决策和控制能力 。 纯视觉的挑战在于 , 其不像激光雷达一样采用“拿来主义” 。 激光雷达可以直接生成三维的点云信息 , 特别是在城市复杂场景中 , 可以直接输出物体检测、分类等精准信息点 , 与视觉传感器融合为辅助驾驶提供感知保障 。 与特斯拉的纯视觉感知方案存在类似的挑战 。 由于视觉数据无法与前后帧关联 , 没有“记忆” , 同时基于2D图像没有深度信息 , 因此系统无法对物体的运动直接作出正确的预测 , 并且由于缺乏前后关系无法做正确的规划 。 百度的解决方式是自建一套视觉神经网络系统 , 来提升整个检测效率 , 并利用多任务式的训练框架来提高数据驱动性能 , 以此达到数据闭环 。 值得一提的是 , 百度可以利用搭载激光雷达的L4车队获取来的大量的图像以及点云信息 , 利用深度学习以及车队丰富的数据量提高对目标物模型的检测以及预测能力 。 例如 , 利用模型学习以及几何推理 , 系统可以在子模型端上从过去预测的2D结果升级为2D+3D信息的融合 , 从而提高复杂场景的识别 。 包括我们常见的复杂车辆检测分类、复杂的十字路口红绿灯识别、车道线检测等语义场景 , 百度ANP可以通过ApolloLite处理得更为高效 。