深度学习|向3D进军,英伟达基于PyTorch的3D深度学习库Kaolin安装使用

深度学习|向3D进军,英伟达基于PyTorch的3D深度学习库Kaolin安装使用

平时我们在进行深度学习训练和学习时 , 大概并不涉及三维领域的应用 。 毕竟 , 简单的文本、静态的图片要训练这么一类东西 , 就已经够折腾GPU非常考验机器实(财)力的了 , 而更进一步 , 涉及到视频类的机器学习更是比较罕见 , 甚至我们都不怎么熟悉常用的数据集 。 因此就更甭提3D方面的AI应用了 。 然而 , 我们不涉及并不代表世界没有 。 比如英伟达这个Kaolin就是 。
当然 , 这个3D深度学习库并不是新玩意儿 , 在2019年12月份里就开源了 。 彼时还是重磅亮相的 。 乍一看 , Kaolin还以为是Kotlin编程语言 , 它当然不是编程语言 , 它只是英伟达开源的基于PyTorch的3D深度学习加速工具库 。
看介绍 , 这个封装了常用的可微图形模块 , 包括渲染、照明、阴影和视图扭曲的工具库 , 提供了可用于三维深度学习系统的可微三维模块 , 它具有加载和预处理常见的三维数据集的功能 , 同时实现了处理网格、点云、符号距离函数和体素网格的函数 , 从而减少了编写样板代码的负担 。

上面的表述看起来很学术 。 其实 , 举个例子大家可能就知道了 。 之前有一个开源的项目 , 也就是那个可以把3D白模上材质贴图完成风格化变换的AI应用 , 看起来很炫酷吧 , 那个就用到了Kaolin这个工具库 。
由此我们可以大胆想象出 , 如果电脑硬件特别是显卡跟得上 , 学学技术 , 就可以用这个3D做很多东西 , 拥有很大的想象空间 。 要知道 , 3D这块 , 不仅仅是建模上材质风格化这么简单 , 3D领域的深度学习 , 经常与某些复杂任务高度相关 , 如机器人啦自动驾驶啦增强和虚拟现实啦这些有关系 。 因此 , 值得关注学习 。
这个库 , 由于属于英伟达——目前市场上 , AI领域训练学习几乎唯一的GPU厂家——因此安装 , 也和其他第三方库不一样 , 机智客这里是用Ubuntu20.04系统来安装学习的 , 我们不能直接pip install Kaolin就能安装的 , 不行的 。 如果我们那么安装 , 是毫无用处的 , 终端会提示Successfully installed kaolin-0.0 。 显然不行 , 此时就需要上Github上git clone库 , 然后进入相应目录 , 然后Python setup.py develop才行 。 当然 , 官方也提醒了 , 最好在独立虚拟环境中比如anaconda中使用 。
【深度学习|向3D进军,英伟达基于PyTorch的3D深度学习库Kaolin安装使用】而只有这样把Kaolin安装了 , 在pip列表里面才能找到kaolin已经安装的版本 。 这里安装的是0.9.1版本 。 接下来我们就可以使用它开展我们接下来的3D深度学习之旅了 。