我们尝试让绘画ai成为负责插图的新同事( 二 )


一般而言 , 用一组关键字生成4张512×512的例图大约需要1积分 。 每个绘画AI的积分定价略有差别——DALL?E的付费积分相对更贵一些 , 大约是15美元115积分 , 折合人民币大约1元生成一次;Midjourney提供了每月10美元约200张图的包月套餐 , 算下来便宜不少 。
不管是DALL?E、Midjourney还是StableDiffusion , 最关键的 , 当然还是图片生成的质量 。 我们使用了几组不同的关键词 , 测试AI们的表现 。 描述与关键词
在插图这方面 , 相比起精美的3D建模图片或是贴近照片的现实风格图片 , 祝佳音老师更加青睐的是手绘杂志插图风格 。 但在风格的描述上却遇见了不少麻烦:该怎样告诉AI我们需要什么?
一开始 , 我们尝试用某一本杂志的刊名笼统地描述它的插图风格:例如 , 在关键词里加上《纽约客》(NewYorker) 。 问题随之而来:即使在同一本杂志里 , 插图风格并非单一不变 。 在这一点上 , 免费的StableDiffusion为我们提供了不少试错的案例——即便你加入了“手绘”“无模糊”“清晰线稿”与艺术家的名字等关键词 , 绘画AI还是不太明白你究竟想要什么 , 只能一次给你端上来几张不同风格的图片任你挑选 , 你可以看得出来 , 这些风格确实都曾出现在杂志中 。 至于是否能够找到你想要的 , 就得指望运气了 。
我们尝试让绘画ai成为负责插图的新同事
文章图片
指定的范围比较宽泛时 , StableDiffusion会一次生成数张不同风格的图片
想知道某种具体绘画风格的名字也不算容易 。 在大多数情况下 , 我们想了半天也只能想出来“手绘”或是“水彩”等笼统的描述 。 好在我们找到了搜索引擎Lexica , 网站上整理了不少描述词与生成图片的案例 , 可以通过文字或是图片搜索找到你想要的词汇 。
我们尝试让绘画ai成为负责插图的新同事
文章图片
Lexica上可以搜索到其他用户分享的案例
不过 , Lexica也并非百试百灵 。 一方面 , 如果你瞄准的是不那么大众的艺术家 , 尝试生成对应风格图片的用户不多 , 能提供的例子也十分有限 。 另一方面 , AI生成图片的过程伴随不小的随机性 , 用户上传的图片与关键词不是每次都足够准确——上传的例图看起来不错 , 实际生成时怎么也跑不出类似的图片更是常态 。
StableDiffusion的问题在这里也渐渐显露:模型在生成真实照片风格或是细腻的原画风格上可谓一骑绝尘 , 特别是更新后的StableDiffusion2.1版本 , 生成的照片风格图像几乎可以以假乱真 。 但相对应的 , 当涉及相对平面的艺术风格时 , 想要生成出合适的图片 , 需要做出不少尝试 。
我们尝试让绘画ai成为负责插图的新同事
文章图片
StableDiffusion在生成真实照片风格的图片上做得相当好
我们尝试让绘画ai成为负责插图的新同事
文章图片
生成平面风格的图像 , 则需要更多尝试
当然 , 描述词带来的门槛也是问题之一——任何人在生成图片的过程中 , 不断调整、修正并找到合适的关键词同样需要时间 。 从这一点上来说 , StableDiffusion对零基础使用者并非那么友好 。 如果不细致调整关键词 , 直接用自然语言描述想要的图片 , 可能需要生成不少图片才能获得一张令人满意的图像 。 例如 , 我们描述了一个具体的场景:“一个女孩在堆满了杂物的办公桌前 , 桌上的外卖袋和泡面摞得很高 , 墙上有个日历 , 日历上‘发售日’后面的数字被红笔划掉了好几道 。 女孩抱着头 , 显得非常痛苦 。 ”