打破大模型的“空中城堡”，BMVC最佳论文Runner-Up得主谈多模态与具身学习( 三 ) 两只新生猫的运动方式是否为

在“2.5DVisualSound”项目中，高若涵就发现：缺少双声道的视频，或者声音数据集很小，没办法训练出mono-to-binaural的模型。
最终他们决定自己收集一个数据集，并模仿具身学习自主组装了一个收集数据的仪器。

文章图片