英伟达|在花了两小时体验英伟达升级版“神奇画布”后,整个人都凌乱了( 三 )


输入单词“沙发(Sofa)”时 , 返回来的图是这样的 。 如果有人看懂了这跟沙发之间的关系 , 麻烦留言解释一下 。
输入单词“圣诞树(Chritmas tree)”时 , 返回的图片是这样的 。 感觉不像是圣诞树 , 倒有点中国春节灯会的感觉 。
而除了文本转换 , 涂鸦模式也在接下来的体验中屡屡翻车 。 比如硅星人想画一个“小河边一座房子 , 房旁立着一颗树”的情景 , 在使用各种类别的画笔在画不上画出布局之后 , 生成的图像里就没有小河 , 画风也非常诡异 , 完全跟想要呈现的宁静画面大相径庭 。
想画“两山之间一座桥”的情景 , 返回的画风也是十分灰暗 。 虽然硅星人也承认自己是灵魂画手 , 但也没有必要这么“灵魂”吧?
而在多次尝试和摸索后 , 硅星人终于总结出了一个用GauGAN 2返回正常画作的规律 。
首先 , 在文本生成部分 , 输入的文本最好都跟自然景观相关 , 且形容词越简单越好 , 像大海、湖泊、山、岩石、树这些关键词都能比较准确返回结果 。 在涂鸦部分 , 尽量不要给画布留白 , 比如在画河流或湖泊时 , 周边也要画上土地或者草地 , 在涂鸦时也要尽量精细 , 这样系统会更容易理解你想要的感觉 。
这背后的原因则是因为目前用于训练GauGAN 2的图像大部分都是风景类的 , 导致模型结果存在偏差 。 此前 , 英伟达也公开表示 , GauGAN 2模型有超过 1 亿的参数 , 但目前训练时间还处于初始阶段 。 训练图像几乎都来自专有的风景图像数据集 , 因此系统识别目前也只专注于风景 。
虽然GauGAN 2仍然还在Demo阶段 , 自己的作品也都大部分翻车了 。 但硅星人也发现很多大神已经使用GauGAN 2创作出了很多有趣的作品 。
感兴趣的小伙伴假期无聊的话也可以自己去玩一玩:
期待看到你们的大作!