万字长文讲透AI艺术:缘起、意义和未来( 二 )


万字长文讲透AI艺术:缘起、意义和未来
文章图片
DD绘制的中国二十四节气
AI艺术领域并非由开源独撑 , 时至今日商业化最为成功的当属MJ 。 而MJ不仅完全闭源 , 还倡导付费模式 。 这种底气当然来自其核心可控的技术、强大的产品、顶级的算法、不断进化的数据集 , 使得MJ的出图已经进入“大成之境” , 不论从逻辑性还是细节都几乎与人类艺术家难解难分 。 迄今为止 , MJ共发布了四个版本 , 而每个版本都有其“致命性”的革新 , 如v2版的“美学”、v3版的“逻辑”、v4版的“无可挑剔” 。 每次的新版本发布都无不让全世界为之欢呼和追捧 , 这种场面不禁令人想到了当初iPhone从初代开始的每一场发布 。 有人戏称 , DD是塞班 , SD是安卓 , MJ则是苹果 。 戏谑之中 , 暗藏着历史的重演 , 未来已在此处 , 只是分布不均 。
靠着不断进化的“深度” , MJ全年都处于兴盛不衰的状态 , 是所有AI艺术创作者都顶礼膜拜的“冈仁波齐峰” 。 虽然MJ并没有进驻中国消费市场 , 但凭借着大模型(BigModel)之“大力出奇迹”的精髓 , 加上MJ每天都在扩充自己的训练数据集 , 这个扎根于海外的产物竟也十分理解中国元素 。 很多国内用户用它刻画古风、武侠、神兽、古建筑等系列 , 并燃爆了整个抖音和小红书的公域流量 , 好的作品点赞量都高达一百多万 , 比很多粉丝数上亿的头部主播发布的日常状态都高 。 也许在七八月份的时候 , 很多用户还能挑出MJ出图的各种问题和瑕疵 , 但今天更多的是折服与认可 , 随之而来的便是持续的商业化输出 。 MJ的创作者群体已经逐渐从一开始的纯兴趣爱好慢慢扩展至使用MJ进行商业设计与变现的职业群体 , 涉及影视制作、游戏设计、UI设计、原画、插画、壁纸、数字艺术、数字藏品、元宇宙视觉等多个领域数百万人的辐射 。
MJ目前将社群构建在海外社交软件Discord之上 , 从0到100万人仅仅不到半年时间 , 而更是在随后的两个月时间内从100万干到了近400万左右的规模 。
可以说MJ社群的规模增长速度恰如其分地反映了整个AI艺术行业2022年的发展轨迹和无尽潜力 。 作为AI艺术皇冠上的明珠 , MJ的存在无疑给了从事这个行业的创作者和创业者更多的信心和鼓舞 , 因为它在不断证明——AI艺术的进化是永无止境的!
万字长文讲透AI艺术:缘起、意义和未来
文章图片
AI艺术家AIBEN使用MJ创作的科幻作品
在技术基因上 , SD跟MJ有着太多相似、相比、相拼之处 。 比如出图时间都在1分钟以内 , 甚至秒级 , 这得益于像SD利用潜空间(latentspace)极大地提升了扩散模型的绘制效率 , 将原本二维的像素空间画布降维至一维的潜空间 , 这不仅仅是压缩了时间 , 更让图像匹配人类描述的精准度大大提升 , 因此这类模型相比于初代的扩散模型更具商业落地可行性 , 可满足千万乃至上亿人参与的新消费场景 。
时至今日 , 由MJ和SD领衔的AI艺术消费市场已经在全球突破了一千万用户的大关 , 并在疯狂地向一亿全球用户的新征程迈进 。 但SD目前在输出图像的艺术水准上相比于MJ还存在一些进步的空间 , 这与我们接下来要讲得息息相关 , 也是SD生态正在努力的方向 。
目前SD生态由公司实体StabilityAI和RunwayML共同领衔推进 , 与此同时一些第三方社区力量也举足轻重 , 诸如SDwebui项目、众多二次元改进项目、可用于训练SD新模型的dreambooth生态、可用于精准控制SD画面输出的交叉注意力技术方向等等 。 百花齐放 , 生态犹如热带雨林一般 , 可能每天都有生与死 , 但生生不息!