医生|2022,谷歌、抖音和百度涌向AIGC( 三 )


那场万象大会上 , 百度就推出了基于文心 AI 大模型的「创作者 AI 助理团」 , 由 AI 文案、AI 画师和 AI 视频制作人组成 。 理想状态下 , 借助「创作者 AI 助理团」 , 一个人就可以是一支视频团队 。
但显然 , 现实是 AI 视频生成还需要一些时间 。
ChatGPT , 属于AI的「初代iPhone」12 月初 , OpenAI 发布了 ChatGPT——一个对话式 AI , 发布后很快就在小范围内流行起来 , 随后持续发酵并风靡全网 。 从敲代码、写稿、写诗、推荐到教你学英语、写小说 , 甚至是一场类似人类之间的对谈 , ChatGPT 都表现出了惊人的语言对话能力 。
ChatGPT 甚至一度拉响了谷歌搜索的红色警报 。

用 ChatGPT 修 bug , 图/@amasad
与 OpenAI 之前发布的产品不同 , ChatGPT 选择面向公众大范围公测 , 短短 5 天 , 其用户注册量就突破了百万级 , 这在互联网增长集体放缓的 2022 年多少有些不可思议 。 即便到了岁末年初 , 很多用户依然在使用 ChatGPT 做报告、写年终总结等事务 , 可见其表现带来的用户粘性 。
ChatGPT 之所以脱颖而出 , 普遍认为很大程度上是因为它采用了很自然的措辞进行对话 , 有网友评价其使用体验「就像平常聊天」 。 而 ChatGPT 背后的核心之一是使用 GPT-3 的新版本 GPT-3.5 来进行对话 , 该版本拥有 1750 亿个模型参数 。
事实上 , 从 GPT-3 引发全球范围 AI 大模型的军备竞赛开始 , 这件事一定程度上就是巨头之间的比拼 。 谷歌在 2021 年推出了万亿级参数的 AI 大模型——Switch Transformer , 微软和英伟达烧坏了 4480 块 GPU 后 , 才开发出 5300 亿参数的自然语言生成模型 MT-NLG(威震天-图灵) 。

「钱」 , 图/英伟达
根据媒体报道 , GPT-3 训练的仅是硬件和电力成本就高达 1200 万美元(约 7500 万人民币) , GPT-3.5 应该只高不少 。 目前 ChatGPT 仍然是免费使用 , 但显然 OpenAI 不可能一直免费开放下去 。
另一个对话式 AI 的问题在于——自以为是 。 大量的用户对话已经证明 , ChatGPT 的回答并不可靠 , 但它又经常以令人信服的方式「胡说八道」 。 OpenAI 也承认 , 尽管 ChatGPT 生成的回答从语气上已经非常逼近真人 , 但有时仍会给出完全错误的答案 。
这不是在否认 ChatGPT 带来的惊艳 。 Box CEO 亚伦·莱维认为 , 「当一种新技术已经到了改变你对计算机的看法时 , 你会有一种特定的感觉 。 谷歌做到了 , 火狐做到了 , AWS(亚马逊)做到了 , iPhone 做到了 , OpenAI 正在通过 ChatGPT 做到这一点 。 」
写在最后过去十年 , 可以说互联网和智能手机彻底改变了内容的分发和消费环节 , 但在内容生产领域本质上没有过多的变化 。 而在过去一年 , AIGC 已经带来了太多的变化 , Stable Diffusion、Imagen Video 和 ChatGPT 分别对应了最主要的内容形式——图像、视频和文本 。
当然 , AIGC 还在面对很多挑战 , 包括版权、生成质量不稳定、创作主体争论等 , 甚至 AI 生成视频还没有经过大众使用验证 。 但现如今 AIGC 开始「飞入寻常百姓家」 , 已经具备了成为一项大众化技术的基础 , 未来很可能极大地提高内容的生产效率和丰富度 。
从《太空歌剧院》获得艺术大奖到今天 , AI 的争论依然没有停止 , 但就如 Jason Allen 为自己的事件所做的总结:AI 作画程序已经诞生 , 人们能做的只有承认并接受这件事 。
题图来自 StabilityAI