Stable Diffusion团队放大招！新绘画模型直出AI海报，像素级生成

Admin发表于 2023-09-21 09:05:31215 次浏览

在实际案例的操作过程中，我们可能会遇到“Stable Diffusion团队放大招！新绘画模型直出AI海报，像素级生成”这样的问题，那么我们该如何处理和解决这样的情况呢？这篇小编就给大家总结了一些方法，具有一定的借鉴价值，希望对大家有所帮助，接下来就让小编带领大家一起了解看看吧。

AI画文字终于能画对了

开源AI绘画扛把子，Stable Diffusion背后公司StabilityAI再放大招！

全新开源模型DeepFloyd IF，一下获星2千+并登上GitHub热门榜。

DeepFloyd IF不光图像质量是照片级的，还解决了文生图的两大难题：

准确绘制文字。（霓虹灯招牌上写着xxx）

以及准确理解空间关系。（一只猫照镜子看见狮子的倒影）

网友表示，这可是个大事，之前想让Midjourney v5在霓虹灯招牌上写个字AI都是瞎划拉两笔，对于镜子理解的也不对。

使用DeepFloyd IF，可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画，文字都会以合适的字体、风格、排版出现在合理的地方。

这意味着，AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloyd IF以非商用许可开源，不过团队解释这是暂时的，获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloyd IF仍然基于扩散模型，但与之前的Stable Diffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL，结合超分辨率模块中额外的注意力层，获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间，而是直接作用于像素。

官方还提供了一组DeepFloyd IF与其他AI绘画模型的直观对比。

可以看出，使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字，AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源，谷歌的几个模型更是连个Demo都不给，DeepFloyd IF就成了更实际的选择。

具体生成图像上DeepFloyd IF与之前模型一致，语言模型理解文本后先生成64×64分辨率的小图，再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上，通过把指定图像缩小回64×64再使用新的提示词重新执行扩散，也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外，DeepFloyd IF的优势还在于，IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中，IF-4.3B取得了最好的FID分数，并达到SOTA（FID越低代表图像质量越高、多样性越好）。

谁是DeepFloyd

DeepFloyd AI Research是StabilityAI旗下的独立研发团队，深受摇滚乐队平克弗洛伊德影响，自称为一只“研发乐队”。

主要成员只有4人，从姓氏来看均为东欧背景。

这次除了开源代码外，团队在HuggingFace上还提供了DeepFloyd IF模型的在线试玩。

我们也试了试，很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多，不过既然开源了，相信在中文数据集上训练好的变体也不会太晚出现。

One More Thing

DeepFloyd IF并不是Stability AI昨晚在开源上的唯一动作

语言模型方面，他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna，基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

Deepfloyd IF在线试玩：
https://huggingface.co/spaces/DeepFloyd/IF

代码：
https://github.com/deep-floyd/IF

StableVicuna在线试玩：
https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载：
https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接：
[1]https://deepfloyd.ai/deepfloyd-if
[2]https://stability.ai/blog/deepfloyd-if-text-to-image-model
[3]https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot
[4]https://stable-diffusion-art.com/how-stable-diffusion-work/

以上就是关于“Stable Diffusion团队放大招！新绘画模型直出AI海报，像素级生成”的相关知识，感谢各位的阅读，想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会，如果想了解更多相关内容的文章，欢迎关注群英网络，小编每天都会为大家更新不同的知识。

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：mmqy2019@163.com进行举报，并提供相关证据，查实之后，将立刻删除涉嫌侵权内容。

标签： ChatGPT midjourney 意间绘画 AI绘画 Stable Diffusion AI海报

上一篇：马斯克怒了：我要起诉微软！

下一篇： 11个技巧让你的ChatGPT提示达到新水平

推荐内容

热门信息

docker与jenkins是什么东西，作用是什么
2022-05-12 15:50:57

ChatGPT中文版入口在哪里找?
2023-06-06 09:55:26

两种方法教你如何用ChatGPT接入微信
2023-06-06 10:30:12

通过安装Edge插件Gooreplacer预约NewBing的ChatGPT
2023-06-06 09:28:54

用Python3将ChatGPT接入钉钉消息机器人
2023-06-06 10:31:03

想体验chatGPT？教你注册使用
2023-06-06 10:29:56

最新AI修图软件DragGAN有多强大？
2023-05-26 11:53:04

前端vue请求chatGPT接口实现在线客服系统功能
2023-06-06 09:22:10

chatGPT怎么在PC上安装使用？
2023-06-06 10:35:26

如何搭建chatGPT项目
2023-06-06 10:36:28