仿真|中国自动驾驶进入战略机遇期,如何克服同国外巨头的数据差距( 三 )


已布局这一领域的格物钛首席运营官吴琼婧表示,仿真场景库会是一个非常好的应用。因为长期路侧采集的成本很高,像一辆数据采集车每天会采集10TB的数据,100台车就是PB级的数据量。如果能在海量的数据中快速找到符合需求的复杂场景数据进入模型训练阶段,并且把采集的真实数据转化成仿真场景库,在仿真场景库中做调优,例如把旁边并线的车速提高或者降低15%、或调整角度。这种做法可以仿真创造出更多的数据,来替代高成本的数据采集工作,这一方面的解决方案都可以用数据平台的方式来实现。
仿真|中国自动驾驶进入战略机遇期,如何克服同国外巨头的数据差距
文章插图

吴琼婧 主办方供图
共享开放——中国的尝试
除了增加用户端数据获取的渠道和仿真测试,胡哲俊提出了另一种可能性:数据集的共享,通过车厂、自动驾驶公司之间的数据共享去丰富各自的数据库和数据集,进一步优化算法,提高安全性。
浦维达表示赞同,他认为数据的安全利用是很有商业价值的。现在在马路上各家车企积累的上百万公里的行驶数据,是通过很多辆车叠加起来的,单一车辆的行驶里程和区域也是相对有限的。这个时候就需要大家把数据放在一个公共平台上进行共享、交流,甚至进行交易。小企业或许没有太多人力物力投入到高成本的采集数据运营工作中,这些都可以通过购买服务来解决。综合而言,这些数据是可以不断复用产生规模效益的,无论是政府还是行业组织都应该倡导这种做法。
仿真|中国自动驾驶进入战略机遇期,如何克服同国外巨头的数据差距
文章插图

浦维达 主办方供图
中海庭首席执行官刘奋也对数据开放抱有持坚定不移的支持态度,必须承认汽车工业还是相当保守的,数据掌握在每个车企手中,它的流动性和价值被远远低估了。如果一旦数据能被开放出来,一个超过所有人想象力的商业时代就真的来临了,在这个让人热血沸腾的“数智化”时代,数据开放会极大促进社会运行效率。
不过,劲邦资本合伙人王荣进提出,数据共享是有条件的,应该视具体情况来决定是否开放。比如带有一定公共属性的、和交通路况相关的数据是应该拿出来被积极共享的,但是用户和单车的数据可能车企还会有所保留。胡哲俊进一步补充道:数据应当是在特定生态圈里有限度地被共享,而不是完全面向全社会的、不加限制的开放。这种不加限制的数据共享可能会带来负面的安全隐患。数据具体应该以什么样的形式被共享,会受到怎样的限制是需要整个行业的参与方进一步深入研究的。
在这方面,格物钛率先进行了一些尝试。在今年世界人工智能大会上,格物钛和上海白玉兰开源开放研究院共同发布了《木兰-白玉兰开放数据许可协议》,希望向社会倡导数据开放的标准化、机制化,从法律层面提供一种“社区行为标准”去加速数据开放共享。
坚持难而正确的事情
会议最后,与会嘉宾们表示自动驾驶未来肯定会使人们的出行、生活变得更美好,但是也不能过于保持乐观的态度,这是一件需要坚持的“难而正确的事情”。
道阻且长,生而又有幸。试想未来在全球范围内自动驾驶的渗透率达到10%甚至15%以上,所有的技术问题会从汽车工业的智能网联化拓展到智慧交通的运营管理,自动驾驶将重塑城市形态与生活方式,商业模式和产业边界会经历重构,全新的规则体系会应运而生,身处于这样一个变革时代值得每一个人去证明、实践自己,而现在所有自动驾驶赛道玩家正在做的就是提前布局规则,加速这一时代的到来。