阿里通义千问:推出图像编辑模型Qwen-Image-Edit

8月19日,通义千问宣布,推出 Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于20B的Qwen-Image模型进一步训练,将Qwen-Image的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。这个超强模型不仅能对图片中的文字进行精准编辑,还支持元素的添加(inpainting)、删除(outpainting)、修改、IP 创作、物体旋转和风格迁移等炫酷功能。最实用的是它能自动修复图片上的错别字,简直是设计师和内容创作者的福音!也可以在 [Qwen 官网] (文末入口)选择「图像编辑」功能直接体验。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

一、Qwen-Image-Edit介绍

Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本。它基于20B的Qwen-Image模型进一步训练,成功将Qwen-Image的文本渲染特色能力拓展到编辑任务上,以支持精准的文字编辑。此外,Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL(获取视觉语义控制)和VAE Encoder(获得视觉外观控制),以同时获得语义/外观双重编辑能力。模型特性特性包括:

  • 精准文字编辑: Qwen-Image-Edit支持中英双语文字编辑,可以在保留文字大小/字体/风格的前提下,直接编辑图片中文字,进行增删改。
  • 语义/外观 双重编辑: Qwen-Image-Edit不仅支持low-level的视觉外观编辑(例如风格迁移,增删改等),也支持high-level的视觉语义编辑(例如IP制作,物体旋转等)
  • 强大的跨基准性能表现: 在多个公开基准测试中的评估表明,Qwen-Image-Edit 在编辑任务中均获得SOTA,是一个强大的图像生成基础模型。

二、相关模型与安装(文末网盘有合集)

模型(模型大小20GB+):

  • qwen_image_edit_bf16.safetensors
  • qwen_image_edit_fp8_e4m3fn.safetensors

comfyUI-GGUF暂时应该还没更新,所以加载GGUF版本对应的clip模型会出错。等节点作者更新就好。

下载模型放Diffusion_models

Diffusion model

  • qwen_image_edit_fp8_e4m3fn.safetensors

lora

  • Qwen-Image-Lightning-4steps-V1.0.safetensors

Text encoder

  • qwen_2.5_vl_7b_fp8_scaled.safetensors

VAE

  • qwen_image_vae.safetensors

模型安装路径:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen_image_edit_fp8_e4m3fn.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

 

工作流示例与体验

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

输入一张人物的图片,并输入“在黑板上已经写了“Comfyui资源网:www.comfyorg.cn”,将人物放置在画板前,仿佛正在写黑板报。”的提示词

Qwen-Image-Edit准确生成了这幅画面,且保持了小兔子形象的特点,延续了风格可爱活泼风格,柔光下毛发甚至更加细腻。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

一、水豚为例,在输入对应文字后,Qwen-Image-Edit输出了不同场景的水豚图片。

虽然编辑后的图像与输入图像(最左侧图像)的像素大部分不同,但水豚的形态一致性得到了完美保留。语义编辑功能可以让原创IP内容创作变得轻松便捷,且内容丰富多样。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

新颖的视图合成是语义编辑的另一个关键应用场景:

如下面的两个示例图所示,Qwen-Image-Edit不仅可以将物体旋转90度,还可以进行完整的180度旋转,让用户能够直接看到物体的背面。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit

语义编辑的另一个典型应用是风格转换:

例如,给定一幅输入肖像,Qwen-Image-Edit可以轻松地将其转换为各种艺术风格,例如吉卜力工作室的风格。此功能在虚拟化身创建等应用中具有重要价值。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

二、增删改特定元素,虚拟传达、模拟场景一键完成

除了语义编辑之外,外观编辑是另一种常见的图像编辑需求。外观编辑强调在添加、移除或修改特定元素时,保持图像的某些区域完全不变。开篇提到的案例展示了一个将招牌添加到场景中的案例。如图所示,Qwen-Image-Edit不仅成功插入了招牌,还生成了相应的反射。

下面这个例子演示了如何从图像中去除细发丝和其他小物体。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

此外,图像中特定字母“n”的颜色可以修改为蓝色,从而实现对特定元素的精确编辑。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

外观编辑在调整人物背景或更换服装等场景中也有广泛的应用。下面的三幅图分别展示了这些实际用例。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit

三、精准文本编辑,链式修改书法错误

Qwen-Image-Edit的另一大亮点在于其精准的文本编辑能力,这源于Qwen-Image在文本渲染方面的功底。

以下两个案例生动地展现了Qwen-Image-Edit在英文文本编辑方面的性能:

阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit

Qwen-Image-Edit还可以直接编辑中文海报,不仅可以修改大标题文本,还可以对细小复杂的文本元素进行精确调整。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

最后,通过一个具体的图像编辑示例,通义团队演示了如何使用链式编辑方法逐步纠正Qwen-Image生成的书法作品中的错误:

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

在这幅作品中,几个汉字存在生成错误,Qwen-Image-Edit可以逐步纠正这些错误。例如,用户可以在原始图像上绘制边界框来标记需要校正的区域,并指示Qwen-Image-Edit修复这些特定区域。在这里,演示者希望“稽”字能够正确地写在红色框内,而“亭”字能够准确地呈现在蓝色区域内。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

然而,在实际操作中,“稽”字相对模糊,模型未能一次性将其正确纠正。“稽”字的右下角部分应该是“旨”,而不是“日”。此时,演示员进一步用红框突出显示“日”部分,指示Qwen-Image-Edit微调此细节,将其替换为“旨”。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

通过这种链式、循序渐进的编辑方法,我们可以不断地纠正字符错误,直到达到理想的最终结果。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit
阿里通义千问:推出图像编辑模型Qwen-Image-Edit

总结

综上,我们希望Qwen-Image-Edit能够进一步推动在图像生成领域的发展,真正降低视觉内容创作的技术门槛,激发更多创新应用的可能

下载权限

查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • 免费下载
    免费下载:
    签到可领取积分

查看演示

  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付免费指引:【签到得积分即可下载】 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分免费指引:【签到得积分即可下载】立即支付 支付免费指引:【签到得积分即可下载】立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
5人已打赏
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索