语言模型部分使用的是谷歌自己的T5-XXL编码器 , 将训练好的文本冻结 。
图像生成部分则是一系列扩散模型 , 先生成低分辨率图像 , 再逐级超采样 。
谷歌的T5-XXL有46亿个参数 , 而扩大文本编码器的规模 , 可以有效改善文本到图像的对应关系 , 和图像的保真度 。
此外 , Imagen还使用了另一种称为noise conditioning augmentation的扩散技术 , 帮助模型学习已添加的噪声量 , 从而提高图像的还原性 。
对比来看 , Imagen似乎比DALL·E更具有“写实”的特点:
目前 , 在Imagen官网上已涌现出各种新奇的图像 。
有人给浣熊戴上了宇航员头盔 。
泰迪熊在这里开始游蝶泳 。
还有老鹰型的巧克力冰淇淋(嗯 , 还挺应景) 。
截至目前 , Imagen和DALL·E都还在调试阶段 , 尚未向公众开放 。
One More Thing这次《虎戴VR》AI作画大战中 , 也不乏有失败的作品 。
例如有网友就给出了用DALL·E mini来生成的示例 。
不难看出 , 在这版中的《虎戴VR》中 , 并没有任何VR的出现 , 而且老虎的面部基本上都是模糊不清 。
据网友描述 , 他在生成的过程中 , 只是把“北宋”改成了“南宋”:
画作最难的“形象性” , 在这次有所下降 。
- 摩托罗拉|发布十个月下跌1600元,12GB+256GB,柔性屏旗舰再次“5折”出售
- 红米手机|说实话,我“馋”红米RedmiNote11SE已经很久了
- 小米12大幅“降价”,从3699降至2899元,小屏党可以买了!
- 过来人的经验:“你的朋友圈,不要轻易设置三天可见!”
- 传感器|“一步到位”但无需多花钱,目前这5款手机很超值,买对别买错
- Linux|俄方自主研发“光刻机”技术后,对我国有啥影响?知情人说出看法
- 发布十个月下跌1600元,12GB+256GB,柔性屏旗舰再次“5折”出售
- 周鸿祎|周鸿祎称自己领悟到做带货主播的要务!“不管主持人问什么,我只提自己要卖的货”
- 三星|三星最新科幻手机曝光,竟“抄袭”小米2年前手机,国产争光了!
- 联想|新款联想拯救者R9000P可以“无脑入手”?我为何不推荐购买