借力算法,海天瑞声驾驭自动驾驶“新引擎”

机器之心原创
作者:吴昕
2022年的3月 , 或将被写入自动驾驶史册——美国颁布无人驾驶法规 , 中国也许将从政策层面允许L3自动驾驶乘用车上路 , 国内首条支持自动驾驶的快速路通车运营……毫无疑问 , 自动驾驶已经逐渐从快速迭代迈入大规模落地阶段 。 在这个“临门一脚”的关键时刻 , 想要让汽车本身的算法做到处理更多、更复杂的场景 , 不可或缺的是海量的场景数据支撑 。
通过对话国内唯一A股上市数据服务商—海天瑞声 , 透视AI数据在助推自动驾驶实现的路上 , 所面临的机会与挑战 。
一、自动驾驶数据迎来爆发期
2022年将会是自动驾驶商业化转折点 。
回溯2021年底 , 北京成为国内首个明确认可「RoboTaxi」商业化试点的城市 , 标志着国内自动驾驶赛道迎来商业化运营阶段 。
借力算法,海天瑞声驾驭自动驾驶“新引擎”
文章图片
相关数据和图片来自36氪、汉能投资发布的《2022中国自动驾驶行业研究报告》
借力算法,海天瑞声驾驭自动驾驶“新引擎”
文章图片
Gartner公司2022年汽车行业十大业务趋势
常规自动驾驶汽车服务启动 , 挑战随之而来 , 也是值得关注的业务趋势之一
目前 , 自动驾驶主流算法模型主要以有监督学习为主 , 这需要大量的标注数据对模型进行训练和调优 。 只有通过各个场景的数据迭代 , 自动驾驶才可能真正落地 。
是否能高效获取大量标注数据直接决定了各家能否获得自动驾驶市场上的先发优势 。
尽管一些行业头部企业已经内部搭建起数据标注团队 , 训练数据服务商依然是它们背后无法忽略的存在 。
作为国内训练数据行业的领头羊 , 海天瑞声近几年也开始与一些传统车企、造车新势力以及头部自动驾驶技术公司合作 , 探索如何帮助合作伙伴最大程度释放自动驾驶数据的价值 。
借力算法,海天瑞声驾驭自动驾驶“新引擎”
文章图片
IDC预测 , 到2025年 , 中国人工智能数据采标服务市场规模将达到123.4亿元人民币 。 市场的发展驱动力一方面来源于人工智能市场的迅猛发展 , 另一方面来源于行业用户加大数据采集力度 。
借力算法,海天瑞声驾驭自动驾驶“新引擎”
文章图片
IDC数据显示 , 自动驾驶也是AI基础服务市场当中最具增长潜力的行业
二、把好「第一关」:数据方案的设计能力
与智能家居、新零售、安防等垂直领域相比 , 自动驾驶的数据需求格外“苛刻” , 对数据服务商也提出了新的挑战 。
例如 , 数据样本丰富度层面 , 场景覆盖全面的数据集对自动驾驶系统安全性至关重要 。 想象一下 , 如果高速路上突然出现一群野象 , 或者突然有人横穿马路 , 自动驾驶汽车该如何应对?
这类Cornercase数据很难采集 , 我们不可能真的找一群野象去高速上漫步 , 然后采集数据 。
对于这些现实生活中完全有可能发生的情况 , 系统如果识别不了 , 将会导致严重的后果甚至生命损失 。 所以 , 相应的数据必不可少 , 无论是通过技术手段合成还是模拟 , 数据方案的设计能力都尤为重要 。
此时 , 海天瑞声作为综合数据服务商的显著优势就凸显出来:总的说来 , 行业现阶段训练数据采集标注的定制化需求较多 , 海天瑞声在基础研究上的多年积累 , 使得其能够更好把握现有技术方向 , 深入了解客户对训练数据的运用逻辑和需求痛点 , 保证客户算法取得尽可能好的落地效果 。