• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

挑战GPT-4o!阿里开源Qwen-Image-Edit模型,在中文图像渲染与编辑上取得突破

挑战GPT-4o!阿里开源Qwen-Image-Edit模型,在中文图像渲染与编辑上取得突破
AI TOP100
19小时前

近日,阿里通义千问团队又有大动作,正式开源了全新图像编辑模型Qwen-Image-Edit。这不仅是通义千问系列在图像生成与编辑领域的又一重要成果,更在多个方面展现出卓越性能,有望重塑行业格局。


Qwen-Image-Edit模型的优势

1.中英文双语精准渲染,中文表现一骑绝尘

Qwen-Image-Edit继承并升级了文本渲染能力,无论是英文还是中文,都能实现高保真编辑。它支持直接在图像中添加、删除或修改文本,同时完美保留原有字体、大小和风格。在中文场景下,优势尤为突出。处理多行布局、段落级文本生成以及书法对联等复杂排版需求都不在话下,单字渲染准确率高达97.29%,远超Seedream3.0(53.48%)和GPT Image1(68.37%)。

比如,将海报上的“Hope”替换为“Qwen”,或者在书法作品中修正错误字符,它都能轻松完成,还能保持图像整体视觉一致。这一能力对广告设计、品牌宣传和内容创作行业来说,无疑是一大助力。

2.双重编码机制,语义外观双控

Qwen-Image-Edit的核心技术创新在于双重编码机制。在图像编辑时,输入图像会同时经过Qwen2.5-VL模型进行语义编码,提取高层场景和对象关系特征;还会通过变分自编码器(VAE)进行重建编码,保留底层视觉细节,如纹理和颜色。

这种机制让模型在执行复杂编辑指令时,既能理解语义意图,又能保持视觉保真度。语义编辑中,能将人物姿态调整为“弯腰牵狗爪”,同时保持人物身份和背景一致;外观编辑时,可精确添加带有真实反射的标牌或移除细微头发丝,其他区域不受影响。在IP 创作、风格迁移和新视角合成等场景中表现出色。

3.多任务训练,编辑一致性行业领先

通过增强的多任务训练范式,Qwen-Image-Edit支持文本到图像(T2I)、图像到图像(I2I)以及文本引导图像编辑(TI2I)等多种任务。在GEdit、ImgEdit和GSO等图像编辑基准测试中,它均取得SOTA性能,综合评分分别达到7.56(英文)、7.52(中文),超越GPT Image1和FLUX.1Kontext等竞争对手。

值得一提的是其“链式编辑”能力。在书法纠错场景中,模型能通过多轮迭代逐步修正错误字符,同时保持整体风格一致,大幅提升了创作效率,降低了专业视觉内容创作的门槛。

开源赋能,推动全球AI创作生态

Qwen-Image-Edit基于Apache2.0协议完全开源,用户可通过Hugging Face、ModelScope等平台免费获取模型权重,还能通过 Qwen Chat的“Image Editing”功能在线体验。阿里在ComfyUI中提供原生支持,并发布详细技术报告和快速上手指南,方便开发者快速集成。

社交媒体上,开发者反响热烈,称其“将中文渲染和图像编辑能力拉到商用水准”,效果“媲美甚至超越GPT-4o和FLUX.1”。此外,模型支持多种LoRA模型,进一步扩展了在高真实感图像生成中的应用场景。

体验地址:Qwen Chat网页版官网入口

登陆Qwen Chat官网首页--点击左上角Qwen Chat---现在开始--点击图片编辑即可

Qwen-Image-Edit模型

Qwen-Image-Edit模型

应用场景广泛,适合多行业

Qwen-Image-Edit的多功能特性使其适用于多种场景。在海报与广告设计领域,能生成具有视觉冲击力的宣传海报,支持复杂文本排版和风格迁移;IP内容创作中,可基于品牌吉祥物生成主题表情包,保持角色一致性;教育与培训方面,能快速生成高质量插图和图表,提升课程内容吸引力;游戏与影视行业,可支持角色设计、背景生成和新视角合成,优化资产开发流程。

用户反馈显示,其直观操作和高质量输出是非专业设计者的理想工具。一位内容创作者表示:“Qwen-Image-Edit 让我在几分钟内完成营销视觉设计,文本渲染精准,效果堪比专业软件。”

阿里通义千问团队的Qwen-Image-Edit,凭借强大的文本编辑能力、双重编码机制和开源特性,为 AI图像生成与编辑领域树立了新标杆。无论是中文渲染的领先,还是语义与外观编辑的平衡,都展现出其作为行业顶尖模型的实力。


想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流24群

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • Qwen Chat
相关资讯
  • DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析

  • DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界

  • ElevenLabs双更新:视频秒变配乐,学生白嫖1500美元AI工具!

  • 淘宝神秘新功能“AI万能搜”来了!灰度测试开启,购物方式要变天了?

  • 挑战GPT-4o!阿里开源Qwen-Image-Edit模型,在中文图像渲染与编辑上取得突破

热点资讯

字节跳动Seedance Pro上线Higgsfield:无限免费生成,30多种电影级预设

6天前
字节跳动Seedance Pro上线Higgsfield:无限免费生成,30多种电影级预设

B站测试AI视频工具花生AI:3分钟成片,创作者迎来“傻瓜式”神器

6天前
B站测试AI视频工具花生AI:3分钟成片,创作者迎来“傻瓜式”神器

阿里通义重磅发布Wan2.2-I2V-Flash:图生视频效率飙升12倍,成本低至0.1元/秒!

8天前
阿里通义重磅发布Wan2.2-I2V-Flash:图生视频效率飙升12倍,成本低至0.1元/秒!

一张图秒变3A游戏大片!腾讯混元Hunyuan-GameCraft开源,游戏开发门槛彻底被拉低

5天前
一张图秒变3A游戏大片!腾讯混元Hunyuan-GameCraft开源,游戏开发门槛彻底被拉低

快手可灵2.1模型内测:首尾帧功能上线,视频创作“精细度”大升级

4天前
快手可灵2.1模型内测:首尾帧功能上线,视频创作“精细度”大升级
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有