鲁汶大学|北大校友马里千:计算机视觉商用的下一个十年,AI 生成应占有一席之地( 六 )
市场会为了AI内容自动生成而买单吗?马里千也想过这个问题。
除了马里千,实验室里的大部分同事都是研究识别、分割、机器学习或机器人,与他的研究方向最接近的,可能是一位叫贾旭的师兄。贾旭现任大连理工大学人工智能学院副教授,此前曾做过将人的侧脸转为正脸的研究,以及场景预测,马里千与他也一直有在合作。
之前有一次,马里千与一位做模型压缩的同事聊天,他提议可以做生成类模型的压缩,同事反问:“生成模型有什么用?”他说,应用很多呀,可以做图像编辑、数据增广等等,但这个答案没有引起同事的兴趣。
还有一次,在一个学术研讨会上,台上的演讲者正在分享一个从图像到图像的翻译工作,台下的观众问:“这个有什么用?”报告者尴尬地说了一句:“娱乐(Entertainment)。”
在思考研究图像合成的应用意义时,他针对人体合成与场景合成在数据增量的应用进行了探索,希望图像合成的落地能够不仅局限于娱乐与图像编辑。后来,在接触工业界的过程中,马里千了解到,其实图像合成有许多潜在应用,比如Codec Avastar可以用来远程交流,电商、视频网站、VR/AR等技术中的内容生成也会用到图像合成。
想法的落地,需要“天时、地利、人和”。去年3月,在与朋友张诗莹等人深入探讨后,他们一致认为,在多媒体时代,图像/视频内容自动生成是未来的趋势。如果人只是提供一个创意,让 GAN、DALL·E等生成模型自动生成内容,那么不仅可以降低内容的生产门槛,还能提高生成的效率。
“多媒体内容的制作成本非常高,比如一条抖音短视频,要有创意,有后期制作,还有演员、摄影师等等。而当你投入很大的成本去拍一条视频时,你并不能确保你的视频能够吸引到很大的流量。”在这种情况下,AI 自动生成技术无疑能大大降低创作的时间和金钱成本,让创作者只要给出最核心的idea、便能看到 AI 生成的优质内容,减少投入的成本和风险。
一拍即合后,ZMO.AI应运而生,成立不到一个月,就拿到顶级风险投资机构GSR Ventors 金沙江创投和 GGV 纪源资本上千万的融资金额,估值近亿。
ZMO的落地重心是打造世界上最前沿的人工智能的内容生成引擎:从一张简单的衣服照片,或是一句文字的描述,就可以直接生成以假乱真的2D效果图或者视频。他们坚信未来的世界万物皆可生成,这将彻底重塑人类生产内容的方式,颠覆传统互联网内容生成的底层逻辑。
目前,ZMO在发展的第一阶段,便已能利用算法与数据,降低多媒体内容的生产成本,帮助诸多头部电商实现降本增效。
张诗莹谈道:“信息时代,我们缺的不是内容,而是有差异化的高质量内容。从GAN的诞生至今,AI在内容生成方面的技术发展已渐趋成熟,很大希望成为AI商用的下一个风口。”
做内容生成,你“GAN”吗?
当人脸识别、产品瑕疵检测等应用广泛落地时,人们也逐渐将对 AI 感知技术的关注转向其他领域,比如认知智能。但马里千认为,在 AI 的下一个十年里,内容生成应占有一席之地。
相比赋予机器知识与推理能力的漫长道路,让机器执行人类的概念与想法似乎更简单,尤其是在图像与视频的内容编辑上。除了老照片修复、换脸、换装等简单应用,如果计算机视觉的深度合成技术能够用于大脑画面的还原,比如自己写一个《权力的游戏》大结局剧本,合成一部只属于自己的电视剧,那么人人都有成为导演的机会。
这是马里千的梦想,也可能是你的梦想。
在采访的最后,我们问马里千,他如何看待ZMO的未来。对于这个问题,马里千没有正面回答,只给了一句意味深长的感慨:“不要忘了,像视觉四小龙的崛起,也仅仅是这几年的事。”
- 36氪5G创新日报0112|福建省首个“5G+VR”英模会客厅正式上线;齐鲁医院健康管理中心“5G+ 5g
- 单片机|OPPO最新实验室曝光:与华中科技大学联合打造,将加速新技术研发
- 湖南|湖南着力推进5G应用发展 岳麓山大学科技城5G加速港启用
- 腾讯&复旦大学元宇宙报告,七大分类构造元宇宙生态,“元宇宙率”定义行业标准 | 智东西内参
- 显卡|这所新大学仅成立四年,就被华为选中并签约,它到底是什么来头
- 齐鲁壹点|36氪首发 | 「艾灵网络」获数千万元Pre-A+轮投资,为工业领域搭建最后一公里ICT基础设施
- 天津商业大学|科技手段助力天津应对本轮本土疫情
- 华东师范大学|证券之星APP
- 任正非:我退休以后想找一个好大学,学数学
- 大学生寒假假期规划