新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少

IT之家 9 月 19 日消息 今日字节跳动技术团队在其官方公众号发表文章,介绍了字节跳动的一项深度学习新技术。深度学习模型中的生成式对抗网络(GAN),可以用于图片风格迁移、图像编辑、图片生成等场景,为画面以及视频改变风格。
举例来看,该技术可以将一匹棕色的马变成斑马,或者将莫奈的风景画变成真实的照片。依据一个 鞋子的轮廓,可以自动生成真实的鞋子图形。
新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章插图

新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章插图

字节跳动表示,图片风格迁移、图像编辑、图片生成等场景。2020 年,麻省理工学院、Adobe 和上海交通大学技术人员提出一种 GAN 压缩算法,将算力消耗成功减少到 1/21。
最近,字节跳动技术团队推出了一项自研 GAN 压缩算法,名为“在线多粒度蒸馏技术”,简称 OMGD。这项算法能够极大降低 CycleGAN 和 Pix2Pix 模型的算力消耗,分别降至原来的 1/40 和 1/46。不仅参数和计算量更少,图像生成效果也更好。
新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章插图

上图的结果显示,OMGD 消耗的计算量仅为 1.219G,相比于原始状态的 56.8G,计算量大幅减少,生成效果也更优。
IT之家了解到,目前 OMGD 技术已经应用在多款抖音智能特效中。比如“三屏人生”,可以将过去、现在、未来的自己实时展现在屏幕上。
新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章插图

使用动态照片功能,可以让静态画面动起来,表情丰富逼真。
【 新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少】新技术|字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少
文章插图