如果AIGC继续发展,你相信哪个世界?( 四 )


这样的观察与上文我们观察到的一些论调非常相似 , 今天创业者希望通过利用与自身业务相关的数据、经验、技巧等去自己构建当下的最好的大模型 , 的确有机会在自身领域带来超过今天大模型基础设施公司公开提供API的效果 , 然而这也同样意味着企业要一直分配一大部分精力和资金在基础模型的研发上 , 那自然放在业务上的资金和精力则会减少 。 PMF(Product-marketfit)以及PMF之后的业务拓展 , 都需要企业投入全部的精力来完成 , 这大模型所需要耗费的研发投入和资金成本显然与集中精力做PMF有一些矛盾 。
对于以上的问题 , 目前AIGC创业公司中已经实现PMF和商业化拓展的两个代表性公司Copy.AI和Jasper.AI并未纠结 。 前者在成立的一年内实现了1000万美元的ARR , 而后者则更是厉害 , 在成立的2年内实现了4000万美元的ARR , 预计在今年实现9000万以上的ARR 。 两者的共同点都是基于选择了使用GPT-3提供的API进行创业 , 并在GPT-3提供的API的基础上 , 在前端做了大量的控制算法和产品逻辑 , 并集中精力打磨产品 。
如果AIGC继续发展,你相信哪个世界?
文章图片
值得警惕的是 , 大模型是一直在进步的 , 耗费的成本也越来越高 。 OpenAI1750亿参数的GPT-3耗费了大约500万美元的训练资金 , Stability.AI也在维护一个4000多个NvidiaA100GPU组成的集群来训练AI模型 , 显然这么大的训练费用对于创业公司是一个压力 。 虽然StableDiffusion已经开源 , 但在图文生成领域还有更多进步的空间 , 目前来看Stability.AI的方向并非成为图像侧的应用公司 , 而是成为大模型领域的基础设施公司(可能类似于huggingface) 。 那么不禁要问 , 如果有一天Stability.AI像OpenAI一样 , 并不再开源其最先进的模型 , 而是提供商业化调用的时候 , 创业公司是否还要选择自研大模型来保持最先进 , 如果回答是Yes的话 , 资金又要从哪里募集呢?
另外一个值得注意的问题是 , 目前Stablediffusion开源模型所展示的效果并没有在图像领域达成如GPT-3在NLP领域一样的效果 , 虽然其C端火爆的现象仍然持续 , 然而如果真的转化成B端的通用生产力工具 , Stablediffusion还存在无法针对图像做更细节的生成(如手部效果等)、无法制定某个特定区域修改乃至修改后与原场景十分融洽、无法控制画作中不同元素(实体)进行单独修改等诸多问题(截止发稿前 , Stablediffusion2.0已经在11月24日发布 , 变化包括对分辨率的提升、引入图片编辑功能等 , 但上述问题仍然未得到充分解决) 。 简而言之 , 目前除了NLP领域的大模型是相对成熟以外 , 图像的AIGC模型尚且处于早期 , 视频、3D、游戏等内容的AIGC模型则处于更早期阶段 。 因此创业者需要回答的另一个问题是“当底层基础模型尚未成熟的时候 , 是选择在该领域进行创业很好的timing吗?是否应该等到底层模型相对成熟且API就位后才是更好的创业timing?”
以Text-to-Image领域为例 , 自然会有一些勇敢的创业者会去提高当前Stablediffusion的效果 , 自己训练前端的CLIP模型 , 甚至自己训练后端的Diffusion模型 。 的确 , 在当前模型没有发展到一定程度时 , 拿到一笔钱后做出比当下市场上最好的模型效果还要好的模型 , 并为业务产生更好的效果的想法确实非常诱惑 , 这个想法下能够展示出的Demo、优秀的AI团队 , 可能也是令VC沉醉的 。 但回顾NLP的历史 , 如果Copy.AI、Jasper.AI并未在2020年OpenAI研发出GPT-3并开放接口后再选择创业 , 而是在2015年、2018年拿着当时的模型去选择做营销助手的创业 , 其成功的概率会有多大?而从目前的市场情况来看 , 图像、视频领域则尚未出现与Jasper.AI和Copy.AI类似的、已经实现超过千万ARR的新的应用类创业公司 , 更多是原来已经存在的应用公司通过新的模型进行业务能力的增加 。 相信除了StableDiffusion模型开源的时间尚短以外 , 也有着当前最好的模型亦尚未成熟的原因 。 也许 , 在图像等其他内容领域 , 目前时代还在呼唤着与OpenAI类似的提供API的基础设施类公司 , 然后才是应用生态繁荣的开始 。