手机行业|百度语音+自动驾驶感知+深度学习平台技术解析( 二 )



目前 , 百度并没有止步于BEV自动驾驶感知方案 , 还首次在业内提出了车路一体的解决方案UniBEV , 集成了车端多相机、多传感器的在线建图、动态障碍物感知 , 以及路侧视角下的多路口多传感器融合等任务 , 是业内首个车路一体的端到端感知解决方案 。 基于统一的BEV空间 , UniBEV 车路一体大模型更容易实现多模态、多视角、多时间上的时空特征融合 。
百度”飞桨“深度学习平台AI 为解决科学问题带来新方法的同时 , 也对AI基础软硬件带来诸多新挑战 。 毕竟 , 推动科学进步与开发一个人脸识别算法需要的并不完全是一种能力 。
首先 , 深度学习平台需要具备更加丰富的各类计算表达能力 , 如高阶自动微分、复数微分、高阶优化器等;其次 , 科学问题求解需要超大规模的计算 , 这对深度学习平台与异构超算/智算中心适配及融合优化 , 神经网络编译器加速和大规模分布式训练提出了新的要求;此外 , 如何实现人工智能与传统科学计算工具链的协同 , 也是需要解决的问题 。

过去的这几年 , 百度飞桨团队在这些问题取得了进展 。 作为国内首个自主研发、功能丰富、开源开放的产业级深度学习平台 , 飞桨研发了一系列用于科学研究的工具组件 , 比如赛桨PaddleScience、螺旋桨PaddleHelix、量桨Paddle Quantum等 , 支持复杂外形障碍物绕流、结构应力应变分析、材料分子模拟等丰富领域算例 , 广泛支持AI加计算流体力学、生物计算、量子计算等前沿方向的科研探索和产业应用 。
对于科学领域大规模计算的需求 , 飞桨推出了超大规模图学习训练技术PGLBox , 是业界首个同时支持复杂算法+超大图+超大离散模型的大规模图学习训练技术 , 通过显存、内存、SSD三级存储技术和训练框架的性能优化技术 , 单机即可支持百亿节点、数百亿边的图采样和训练 , 并可通过多机扩展支持更大规模 , 目前已经在百度的智能交通、信息推荐、搜索等标杆场景实现落地 , 大幅提升业务效率和用户体验 。
在科研生态方面 , 百度飞桨已经与高校、科研机构等开展了计算流体力学、分子动力学、动力气象学等方面的范例建设 , 并形成了一些开放性的、多学科交叉的生态社区 , 包括飞桨特殊兴趣小组(PPSIG)、共创计划等 。