医生|2022，谷歌、抖音和百度涌向AIGC 高峰|算法|电子产品

文章图片

文章图片

文章图片

文章图片

就在本月， WSJ 引述知情人士称，作为 2022 年爆红的聊天机器人 ChatGPT 背后的公司， OpenAI 正在谈判以收购要约的形式出售现有股份，这起交易对 OpenAI 的估值达到 290 亿美元左右。在 2021 年的一场交易中， OpenAI 的估值还只是在 140 亿美元左右。
估值高涨的背后不只是因为 ChatGPT ， OpenAI 旗下另一个 AI 生成图像模型——DALL-E 2 同样展现了生成式 AI 的能力可以有多高。 2022 年，从 Stable Diffusion 以开源形式引爆 AI 创作，到 GPTChat 一周内就突破了百万级用户注册，全球出现了无数生成式 AI 的产品和创业公司，文本、图像乃至视频，掀起了巨大的 AIGC（人工智能生成内容）浪潮。

AI 绘画，图/抖音
基于 Stable Diffusion 开源模型，字节也推出 2022 抖音年度爆款「AI 绘画」，统计显示有 2758.3 万人使用过这款特效。抖音和快手都看到了 AIGC 技术在图像应用上的巨大价值，快手对 AIGC 的布局也证实了这一点。快手在 11 月联合百度 AI 数字人希加加、度晓晓等发布短视频，进行 24 小时 AI 直播，还通过 AIGC 技术进行作画、写诗、写歌词等。
6 月，一位谷歌高级软件工程师甚至声称，谷歌开发的对话式 AI LaMDA「有意识、有灵魂」，但随后很快被谷歌否认。而在一个月前，谷歌刚刚在 2022 年 I/O 大会上公布了 LaMDA2 ，称其为谷歌有史以来最先进的对话式 AI ，与年底红遍全球的 ChatGPT 有着相同的语言模型技术和原生应用场景。
12 月 16 日，知名学术期刊《科学》杂志公布了 2022 年十大科学突破，记录一年里最重大的科学发现、进展和趋势，其中一项就是「AI 具备创造力」。用我们更熟悉的词就是：AIGC ，即基于 AI 能力的内容创作。
【医生|2022，谷歌、抖音和百度涌向AIGC】当 AI 开始拥有大规模创造内容的能力，很多事情都可能被颠覆。
AI作画开始大众化
图/OpenAI
2022 年 4 月，人工智能研究公司 OpenAI 发布了新版本的文本生成图像程序——DALL-E 2 ，随后一张由 DALL-E 2 生成的「宇航员在太空骑马」图片开始蹿红社交网络。
相比前代， DALL-E 2 生成图像有了更高的分辨率和更低的延迟，同样基于用户描述文本进行生成。不过和之前 OpenAI 推出的产品一样， DALL-E 2 开始并不对外开放，仅限部分研究人员注册使用该程序，一直到 9 月才宣布向公众开放使用，每月仅限 15 个免费图像。
这也为下半年 Stable Diffusion 的爆火和流行提供了机会。如果说上半年最火的「AI 画师」当属 DALL-E 2 和 Midjourney ， 8 月 22 日 Stable Diffusion 发布之后基本就成了「AI 画师」的代名词。
在目前的三大 AI 图像模型中， Stable Diffusion 诞生得最晚，但由于发展良好的开源社区，它的用户关注度和使用范围都超越了 Midjourney 和 DALL-E 。任何人都可以免费使用，任何公司也可以基于开源项目定制自己的 AI 生成图像程序。

「一个不在乎人工智能争论的老艺术家」，图/DrMacabre68
「我们已经看到 3 岁到 90 岁的人第一次开始创作。」StabilityAI CEO Emad Mostaque 在一次采访中说，该公司资助了 Stable Diffusion 的开发。在海外知名论坛 Reddit 的「StableDiffusion」板块下，每天都有用户分享通过 Stable Diffusion 生成新的图像作品。