百度|全球无人驾驶大洗牌,百度Apollo Day宣告Robotaxi进入2.0时代( 三 )


自动驾驶数据集中 , 2D数据容易获取 , 3D数据获取相对困难 。 可以利用2D标注数据和3D标注数据 , 迭代自训练的方法得到一个效果不错的感知大模型 , 再利用大模型对数据进行3D的伪标注 , 同时使用模型蒸馏的方法 , 获得感知效果比较好的小模型 。
3.3 高提纯、高消化的数据闭环是如何设计的?
无人车跑得越远 , 会遇到各种意想不到的场景 , 比如羊群过马路 。 解决罕见、长尾场景 , 是数据闭环的价值 。 与感知、规控、决策的技术栈相比 , 大规模数据闭环的建设是行业里的崭新命题 。

数据闭环的前半是大量数据带来的存储和标注的压力 , 后半是大规模数据用于训练的计算量需求暴增 。 百度Apollo设计的数据闭环 , 核心是解决「高提纯、高消化」的问题 。
在数据提纯上 , 百度的方案是利用车端小模型+云端大模型 , 做高效的挖掘和自动化标注;数据消化架构 , 实现自动化训练 , 具备联合优化和数据分布理解的能力 , 利用高纯度的数据进一步提升自动驾驶系统的整体智能水平 。 除此之外 , 训练、推理以及数据分布在数据消化过程中 , 形成有效的反馈机制 , 进一步提升数据消化的整体效率和效果 。
3.4 L4与L2+共生 , 百度的独家秘技
百度是行业内第一家同时具有L4 Robotaxi技术和量产L2+辅助驾驶方案的公司 。
其内部的判断是:2023年具备城市道路辅助驾驶能力的产品上市后 , 会带动C端用户需求 , 并在2025年引发消费者对高阶辅助驾驶/自动驾驶的需求爆发 。
百度的L2+ 领航辅助驾驶产品ANP 3.0 将在2023年夏天在首家客户的车型上量产上市 , 支持复杂城市道路场景 , 并且衔接融通高速和泊车场景 。
ANP 3.0的硬件是双Orin-X芯片 , 部分配置800万像素摄像头 , 搭载半固态激光雷达 。 从技术特点来讲 , ANP 3.0的视觉感知和激光雷达感知 , 是两套独立运行、低耦合的系统 。
背靠百度Robotaxi的数据积累 , ANP 3.0在BEV的数据供给上有先天优势 , 融合LiDAR信息的L4感知结果可以作为BEV模型的标注数据 , 直接用于模型预训练 。 目前 , 百度Robotaxi的累计里程超4000万公里 。
其次ANP使用了一套为智驾规模化轻地图方案 , 提升安全 , 也降低制图成本 。
百度内部认为实现无人驾驶商业化的最佳路径是:
前期在限定区域实现技术积累 , 通过技术降维和L4数据 , 为L2+产品做热启动;
更长期看 , 利用L2的规模优势 , 提前收集L4泛化所需要储备的长尾问题 。
内部预期未来3 - 5年内 , 百度领航辅助驾驶产品搭载量有望突破百万 , 百万级的车辆营造的数据壁垒也将有效成为L4的技术护城河 。
3.5 One more thing:自研昆仑芯片
目前 , 百度自研的昆仑芯片已经量产了两代 , 实现数万片的商业化部署 。 第三、第四代产品都在研发中 , 三代芯片预计明年量产 , 四代芯片后年量产 。

作为一款云端通用人工智能计算处理器 , 昆仑芯CEO欧阳剑介绍 , 昆仑芯主要是几大优势:是业界为数不多大规模部署的AI芯片 , 具备完善的生态 , 灵活易用 。
自动驾驶的业务和模型算法复杂度不亚于数据中心 , 而昆仑在数据中心积累的优势可以很好地移植到自动驾驶上 。
目前昆仑芯二代已经在百度的Robotaxi系统上进行了完整的适配 , 并开始道路测试 。
4. 什么样的公司有望无人驾驶落地的胜利?
今年无论是特斯拉的AI Day , 还是百度的Apollo Day , 众多科技公司的开放日都变得极其技术化 。
一方面 , 面对自动驾驶、机器人这些尖端前沿的话题 , 行业公司尝试开放一部分的思考加速整个行业的技术推进;另一方面 , 公众对无人驾驶的商业应用、技术实现和使用体验也逐渐显露出了浓厚的兴趣 。