如果AIGC继续发展,你相信哪个世界?

作者:周志峰、胡奇
编者按:
今年以来 , 由游戏设计师杰森·艾伦使用AI绘图工具Midjourney绘制的作品《太空歌剧院》夺下了美国科罗拉多博览会的年度艺术比赛的首奖 , 引起艺术家和社交媒体的热议 , 也让AIGC(人工智能自动生成内容)概念成为AI界年度热词 , 并掀起了一股AIGC投资热潮 。 AIGC真如外界所宣传的那般美好吗?其背后的创新创业生态将如何构建?
从2012年AlexNet取得深度学习里程碑式的突破以来 , 启明创投在过去的十年中都是中国最活跃的人工智能投资机构之一 , 我们见证了人工智能从算法到应用的一次次突破和发展 , 对人工智能的前景我们始终保持着热情和理智 。 启明创投开设硬科技前瞻专栏 , 希望从创投视角深度解读前瞻技术突破 , 多维度剖析行业趋势 , 寻找新锐科技力量 。
如果我和你说 , 未来AIGC可能有两种世界:一种世界是多个大模型基础公司 , 为上游应用提供API和模型服务 , 上游应用公司只需要专注于开发产品逻辑和上层算法;而另一种世界则如同今天的AI公司一样 , 每家公司都根据自身需求研发底层大模型 , 为自身应用提供技术支持 。
你对任何一种世界的相信都将构成你当下投资和创业的选择 , 当然 , 这两种世界也可能存在互相交织的过渡形态 , 但需要你来对过渡形态的持续时间进行判断 , 你会选择相信哪一种世界?
如果AIGC继续发展,你相信哪个世界?
文章图片
AIGC的两种世界
先不用着急给出你的答案 , 再问你两个问题:
1、如果GPT-4 , 或者3年、5年后最好的模型比GPT-3大100倍甚至1000倍 , 作为创业公司是否还要自研?
2、在某个领域的底层基础模型尚未成熟的时候 , 选择在该领域进行创业是很好的timing吗?
如果你对未来的AIGC世界和这两个问题感兴趣 , 我们将进入今天的文章 。 我们将简单回顾近期热闹的AIGC , 从中探寻AIGC在今年火爆的根本原因 , 并将结合强化学习奠基人之一RichSutton的“AI70年惨痛的教训”和Jasper.AI、Copy.AI等公司的发展 , 做出我们对于这个世界的判断 。 相信看完以后 , 你也将会得出自己的答案 。
引爆用户的AIGC如果用一个字形容过去几个月的AIGC(AIGeneratedContent)/GenerativeAI那么应该是“火” 。 Midjourney的作品获得美国科罗拉多州博览会的数字艺术比赛一等奖 , 引发关注和广泛争论 , 有人戏称AIGC让每个画师都在担心失业 。 与此同时 , 今年相对沉寂的VC迎来新风口 , 连续轰炸的AIGC公司的融资消息和新闻让VC又一次产生FOMO(FearofMissingOut)的情绪;DreamStudio、Midjourney等AI作画应用符合视觉消费的时代主题 , 引爆了C端热情 。
如果AIGC继续发展,你相信哪个世界?
文章图片
Midjourney的获奖作品-太空歌剧院ThéatreD’opéraSpatial
其实AIGC并不是一个新颖的概念 , AIGC即用AI算法生成文本或者图像等内容 , 各种NLG(自然语言生成)模型和GAN(生成对抗网络)及其变种模型都是此前的生成式AI模型 。 如果你打开谷歌搜索AIGC , 会发现排在前面的基本都是中文网站 , 因此有人说AIGC是一个国产概念 , 与之对应的海外概念是Gartner在2019年提出的GenerativeAI , 为统一理解 , 本文将采用AIGC来表达AI生成内容 。
我们观察到新一波AIGC浪潮起源于2020年的预训练大模型GPT-3 , 现在火爆的图像生成、视频生成、3D生成等 , 本质是大模型从文本生成扩展到多模态 , 并结合原有模态算法进行实现(当然 , 以图片生成图片等本模态之间的AI生成 , 以及图像生成视频、2D生成3D等跨模态生成也是AIGC , 例如VAE、StyleGAN、Nerf等与AI生成相关的模型都在GPT-3发布之前或之后提出 , 但这些方向的工作并非引爆新一波AIGC的主要原因) 。 因此 , 我们看到的大量AIGC应用 , 目前的表现形式大多为输入一句话 , 生成一句话/一张图/一段视频/一串代码等 。