您现在的位置是:群英 > 互联网资讯 > 人工智能
Stable Diffusion团队放大招!新绘画模型直出AI海报,像素级生成
Admin发表于 2023-09-21 09:05:31215 次浏览
在实际案例的操作过程中,我们可能会遇到“Stable Diffusion团队放大招!新绘画模型直出AI海报,像素级生成”这样的问题,那么我们该如何处理和解决这样的情况呢?这篇小编就给大家总结了一些方法,具有一定的借鉴价值,希望对大家有所帮助,接下来就让小编带领大家一起了解看看吧。




   

AI画文字终于能画对了

开源AI绘画扛把子,Stable Diffusion背后公司StabilityAI再放大招!

全新开源模型DeepFloyd IF,一下获星2千+并登上GitHub热门榜。

DeepFloyd IF不光图像质量是照片级的,还解决了文生图的两大难题:

准确绘制文字。(霓虹灯招牌上写着xxx)

以及准确理解空间关系。(一只猫照镜子看见狮子的倒影)

网友表示,这可是个大事,之前想让Midjourney v5在霓虹灯招牌上写个字AI都是瞎划拉两笔,对于镜子理解的也不对。

使用DeepFloyd IF,可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字都会以合适的字体、风格、排版出现在合理的地方。

这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloyd IF以非商用许可开源,不过团队解释这是暂时的,获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloyd IF仍然基于扩散模型,但与之前的Stable Diffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。

官方还提供了一组DeepFloyd IF与其他AI绘画模型的直观对比。

可以看出,使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字,AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源,谷歌的几个模型更是连个Demo都不给,DeepFloyd IF就成了更实际的选择。

具体生成图像上DeepFloyd IF与之前模型一致,语言模型理解文本后先生成64×64分辨率的小图,再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上,通过把指定图像缩小回64×64再使用新的提示词重新执行扩散,也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外,DeepFloyd IF的优势还在于,IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中,IF-4.3B取得了最好的FID分数,并达到SOTA(FID越低代表图像质量越高、多样性越好)。

谁是DeepFloyd

DeepFloyd AI Research是StabilityAI旗下的独立研发团队,深受摇滚乐队平克弗洛伊德影响,自称为一只“研发乐队”。

主要成员只有4人,从姓氏来看均为东欧背景。

这次除了开源代码外,团队在HuggingFace上还提供了DeepFloyd IF模型的在线试玩。

我们也试了试,很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多,不过既然开源了,相信在中文数据集上训练好的变体也不会太晚出现。

One More Thing

DeepFloyd IF并不是Stability AI昨晚在开源上的唯一动作

语言模型方面,他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna,基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

Deepfloyd IF在线试玩:
https://huggingface.co/spaces/DeepFloyd/IF

代码:
https://github.com/deep-floyd/IF

StableVicuna在线试玩:
https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载:
https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接:
[1]https://deepfloyd.ai/deepfloyd-if
[2]https://stability.ai/blog/deepfloyd-if-text-to-image-model
[3]https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot
[4]https://stable-diffusion-art.com/how-stable-diffusion-work/


以上就是关于“Stable Diffusion团队放大招!新绘画模型直出AI海报,像素级生成”的相关知识,感谢各位的阅读,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注群英网络,小编每天都会为大家更新不同的知识。

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。

相关信息推荐
2023-09-23 10:37:19 
摘要:ChatGPT带火了一个新职业,年薪200W+
2023-06-06 10:32:38 
摘要:对话ChatGPT了解其训练数据,训练过程等内容
2023-06-06 09:54:44 
摘要:ChatGPT 背后的“功臣”——RLHF 技术详解
云活动
推荐内容
热门关键词
元宇宙+chatgpt+midjourney+意间绘画+AI作图 持续进化+chatgpt+midjourney+意间绘画+AI作图 钉钉+chatgpt+midjourney+意间绘画+AI作图 AI整顿职场+钉钉+chatgpt+midjourney+意间绘画+AI作图 主动开卷+chatgpt+midjourney+意间绘画+AI作图 StableLM+chatgpt+midjourney+意间绘画+AI作图 智能化+SaaS公司+chatgpt+midjourney+意间绘画+AI作图 游戏人+chatgpt+midjourney+意间绘画+AI作图 提示工程+chatgpt+midjourney+意间绘画+AI作图 编写提示指南+chatgpt+midjourney+意间绘画+AI作图 CG大佬+chatgpt+midjourney+意间绘画+AI作图 文心一格+chatgpt+midjourney+意间绘画+AI作图 ChatGPT又崩了+腾讯前副总裁+游戏手柄 原画师+chatgpt+midjourney+意间绘画+AI作图 反对ChatGPT+chatgpt+midjourney+意间绘画+AI作图 文心一言发布会+chatgpt+midjourney+意间绘画+AI作图 下载评测+chatgpt+midjourney+意间绘画+AI作图 文心一言+开放测试+chatgpt+midjourney+意间绘画+AI作图 谎言制造机+chatgpt+midjourney+意间绘画+AI作图 midjourney提示词+chatgpt+midjourney+意间绘画+AI作图 聊天+chatgpt+midjourney+意间绘画+AI作图 视频版Midjourney+chatgpt+midjourney+意间绘画+AI作图 伟大的公司+chatgpt+midjourney+意间绘画+AI作图 下一代操作系统+chatgpt+midjourney+意间绘画+AI作图 阿拉丁时代+chatgpt+midjourney+意间绘画+AI作图 文心一言+chatgpt+midjourney+意间绘画+AI作图 chatgpt+midjourney+意间绘画+AI作图 高薪大神+chatgpt+midjourney+意间绘画+AI作图 爆款游戏+chatgpt+midjourney+意间绘画+AI作图 Firefly+chatgpt+midjourney+意间绘画+AI作图
热门信息
群英网络助力开启安全的云计算之旅
立即注册,领取新人大礼包
  • 联系我们
  • 24小时售后:4006784567
  • 24小时TEL :0668-2555666
  • 售前咨询TEL:400-678-4567

  • 官方微信

    官方微信
Copyright  ©  QY  Network  Company  Ltd. All  Rights  Reserved. 2003-2019  群英网络  版权所有   茂名市群英网络有限公司
增值电信经营许可证 : B1.B2-20140078   粤ICP备09006778号
免费拨打  400-678-4567
免费拨打  400-678-4567 免费拨打 400-678-4567 或 0668-2555555
微信公众号
返回顶部
返回顶部 返回顶部