医生|2022,谷歌、抖音和百度涌向AIGC

医生|2022,谷歌、抖音和百度涌向AIGC

文章图片

医生|2022,谷歌、抖音和百度涌向AIGC

文章图片

医生|2022,谷歌、抖音和百度涌向AIGC

文章图片

医生|2022,谷歌、抖音和百度涌向AIGC

文章图片


就在本月 , WSJ 引述知情人士称 , 作为 2022 年爆红的聊天机器人 ChatGPT 背后的公司 , OpenAI 正在谈判以收购要约的形式出售现有股份 , 这起交易对 OpenAI 的估值达到 290 亿美元左右 。 在 2021 年的一场交易中 , OpenAI 的估值还只是在 140 亿美元左右 。
估值高涨的背后不只是因为 ChatGPT , OpenAI 旗下另一个 AI 生成图像模型——DALL-E 2 同样展现了生成式 AI 的能力可以有多高 。 2022 年 , 从 Stable Diffusion 以开源形式引爆 AI 创作 , 到 GPTChat 一周内就突破了百万级用户注册 , 全球出现了无数生成式 AI 的产品和创业公司 , 文本、图像乃至视频 , 掀起了巨大的 AIGC(人工智能生成内容)浪潮 。

AI 绘画 , 图/抖音
基于 Stable Diffusion 开源模型 , 字节也推出 2022 抖音年度爆款「AI 绘画」 , 统计显示有 2758.3 万人使用过这款特效 。 抖音和快手都看到了 AIGC 技术在图像应用上的巨大价值 , 快手对 AIGC 的布局也证实了这一点 。 快手在 11 月联合百度 AI 数字人希加加、度晓晓等发布短视频 , 进行 24 小时 AI 直播 , 还通过 AIGC 技术进行作画、写诗、写歌词等 。
6 月 , 一位谷歌高级软件工程师甚至声称 , 谷歌开发的对话式 AI LaMDA「有意识、有灵魂」 , 但随后很快被谷歌否认 。 而在一个月前 , 谷歌刚刚在 2022 年 I/O 大会上公布了 LaMDA2 , 称其为谷歌有史以来最先进的对话式 AI , 与年底红遍全球的 ChatGPT 有着相同的语言模型技术和原生应用场景 。
12 月 16 日 , 知名学术期刊《科学》杂志公布了 2022 年十大科学突破 , 记录一年里最重大的科学发现、进展和趋势 , 其中一项就是「AI 具备创造力」 。 用我们更熟悉的词就是:AIGC , 即基于 AI 能力的内容创作 。
【医生|2022,谷歌、抖音和百度涌向AIGC】当 AI 开始拥有大规模创造内容的能力 , 很多事情都可能被颠覆 。
AI作画开始大众化
图/OpenAI
2022 年 4 月 , 人工智能研究公司 OpenAI 发布了新版本的文本生成图像程序——DALL-E 2 , 随后一张由 DALL-E 2 生成的「宇航员在太空骑马」图片开始蹿红社交网络 。
相比前代 , DALL-E 2 生成图像有了更高的分辨率和更低的延迟 , 同样基于用户描述文本进行生成 。 不过和之前 OpenAI 推出的产品一样 , DALL-E 2 开始并不对外开放 , 仅限部分研究人员注册使用该程序 , 一直到 9 月才宣布向公众开放使用 , 每月仅限 15 个免费图像 。
这也为下半年 Stable Diffusion 的爆火和流行提供了机会 。 如果说上半年最火的「AI 画师」当属 DALL-E 2 和 Midjourney , 8 月 22 日 Stable Diffusion 发布之后基本就成了「AI 画师」的代名词 。
在目前的三大 AI 图像模型中 , Stable Diffusion 诞生得最晚 , 但由于发展良好的开源社区 , 它的用户关注度和使用范围都超越了 Midjourney 和 DALL-E 。 任何人都可以免费使用 , 任何公司也可以基于开源项目定制自己的 AI 生成图像程序 。

「一个不在乎人工智能争论的老艺术家」, 图/DrMacabre68
「我们已经看到 3 岁到 90 岁的人第一次开始创作 。 」StabilityAI CEO Emad Mostaque 在一次采访中说 , 该公司资助了 Stable Diffusion 的开发 。 在海外知名论坛 Reddit 的「StableDiffusion」板块下 , 每天都有用户分享通过 Stable Diffusion 生成新的图像作品 。