万字长文讲透AI艺术:缘起、意义和未来( 三 )


更值得注意的是 , 扩散模型技术大厦的构建更离不开众多上游大技术的鼎力配合 , 尤其指更精准理解人类语义的大模型技术、文本与图像多模态预训练模型(CLIP)、AI艺术输出质量最为依赖的大规模训练数据集等 。
SD今天的成就离不开当初对LAION数据集的全力支持 , 其中大名鼎鼎的LAION-5B是用于训练下一代图像文本模型的开放式大规模数据集 , 高达58.5亿个图像-文本对 , 共80T数据 , 是世界第一大规模、多模态的文本图像数据集 。
这个数据集的建立并非一朝一夕的工作 , 它是对互联网发展近30年的缩影 , 要对海量的互联网图片做大量的工作 , 诸如提供了色情图片过滤、水印图片过滤、高分辨率图片、美学图片等子集和模型 , 以供不同方向研究 。 这就是互联网的视觉DNA!时至今日则由CLIP、扩散模型等新一代AI技术进行编码演绎 , 去勾勒出互联网未来的模样——元宇宙时代 。 随着LAION的持续进化 , SD也会输出更加高质量的AI艺术作品 , 就像MJ那样 。
诚如StabilityAI创始人Emad所言:“很高兴支持创建这个为下一代模型奠定基础的数据集 。 甚至更好的数据集正在开发中 , 它被设计为广泛的、可扩展的 。 现在我们将向着多样化、专业化和不断提高质量前进 。 ”
万字长文讲透AI艺术:缘起、意义和未来
文章图片
SD绘制的“万事万物”
如今人类有了众多开源与闭源的AI艺术生产力 , 这其中有的可以直接进入商业生产 , 而有的则停留在娱乐体验 , 因此就产生了付费与免费的用户行为 。 对于极致水准的图像生成 , 用户付费的意愿也随之强烈 , 这便是AI艺术这个行业极为明确的发展方向 , 进化是永恒的使命!
(注:全文超万字 , 共分三篇 , 上篇以几大AI艺术模型讲述“缘起” , 中篇以打破“十二道边界”讲述“意义” , 下篇从最新技术动向的角度讲明AI艺术尚存在的进化空间 , 畅想“未来”)