含资量|AIGC的“含科量”与“含资量”( 二 )


随着AI模型GPT-3的问世,机器已经能够达到人类小学的阅读写作水平,顶级AI企业的中文普通话识别准确率能够达到98%以上,多语言、小语种、方言的识别率也不断升级。此外,情感计算、因果计算、知识图谱、元学习等多种技术开始被引入深度学习,大幅改善了人机交互的自然感。
这些新成果应用在内容创作上,就是大家能看到AI写出更流利通顺的文章、用更自然的音色去朗读一本书、更声情并茂地跟人对话、对用户输入的语句理解的更准确,一句话,终于开始摆脱“人工智障”的标签了。
第二,AI基础设施不断发展,多模态大模型的相继成熟落地。
如果只是生成单一的内容,那么AIGC或许还不至于让见多识广的大众眼前一亮。而多模态大模型的出现,让融合性创新成为可能。
多模态大模型,既需要具备NLP(自然语言理解)大模型、CV(计算机视觉)大模型等的能力,理解语言、视觉的内容,还要能够跨模态生成全新的内容,由此带来了非常多的创意空间。比如通过一部小说的文字描写,生成故事画面、人物形象、环境布景等,可以帮助创作者大大节省时间。
正因如此,多模态大模型需要处理的数据类型多,规模量大,模型参数已经达到千亿级别,需要庞大的算力来支撑。得益于全国多地对AI基础设施的重视和建设,才能够让多模态应用达到比较好的效果,进而支撑AIGC创作业态的进一步发展。
含资量|AIGC的“含科量”与“含资量”
文章插图
此外,AI平台化的生态搭建,以及充足广阔的产业实践空间。
大模型虽好,对于很多企业和创作者来说,想要自己从头开发一套大模型用来进行AIGC既不经济、也不现实。这时候,AI平台化、民主化就变得至关重要。
去年推出的许多多模态大模型,如紫东太初、文心、M6等,都通过AI平台进行开源,可以直接调用并通过云端算力进行训练。一些科技企业也将数字人技术开源开放,这些动作大大降低了企业和创业者的开发门槛,创作效率提升,进而助力高质量AIGC变得普及。
目前,南京、武汉等地,已经开始形成多模态应用的产业集群。而千行百业的数字化、数字经济的持续发展,也给予了AIGC前所未有的产业空间与实践场景。比如此次受资本追捧的一些AIGC公司,就瞄准了“游戏+AI”场景,通过算法生成数字人、语言互动等方式,满足玩家在虚拟世界中个性化、定制化的体验需求。而更多的产业实践,也会源源不断地产生新的数据,推动算法的迭代升级。
AI产业化和产业AI化的发展,当下已经能够支持内容创作的大变革,AIGC的流行,自然也就水到渠成了。
“含资量”不低,警惕AIGC的虚火AI创作的大行其道,是科技发展到一定水平后的必然现象。但资本热捧,许多投融资消息突如其来,却给“AIGC”一词添上了一种别样的味道。
为什么说是“突然”呢?如前所说,AI写诗之类的NLG应用并不罕见,但一直没有被以“AIGC”一词整合包装起来。2021年7月,一位股民询问拥有虚拟数字技术开发业务的丝路视觉:在AIGC技术上是否有储备或应用?结果被该企业发言人直接反问:啥是AIGC?显然,当时“AIGC”一词就连从事相关业务的企业高管都不熟悉。
含资量|AIGC的“含科量”与“含资量”
文章插图
而在某问答平台上,关于“AIGC未来会扮演什么样的角色”的问题,只有一个回答,来自某投资机构,而该机构正是某AIGC沙龙的组织方,参与讨论的创始人也主要描绘了一种核心的AIGC应用场景,那就是元宇宙。
而刚刚拿下千万美金融资的某AI公司,正在布局的AIGC领域也聚焦在虚拟人技术,为游戏行业提供基于AI的智能NPC、自动化QA、对话系统和AI陪玩。完成1亿美元融资、由红杉中国领投的某独角兽,核心产品则是AI bot,表示希望作为虚拟世界的先锋,围绕元宇宙开展多维度的基建。