打破大模型的“空中城堡”,BMVC最佳论文Runner-Up得主谈多模态与具身学习( 三 )


在“2.5DVisualSound”项目中 , 高若涵就发现:缺少双声道的视频 , 或者声音数据集很小 , 没办法训练出mono-to-binaural的模型 。
最终他们决定自己收集一个数据集 , 并模仿具身学习自主组装了一个收集数据的仪器 。
打破大模型的“空中城堡”,BMVC最佳论文Runner-Up得主谈多模态与具身学习
文章图片