阿里Qwen-VLo炸场！生图编辑吊打GPT-4o？网友：真香！

阿里Qwen-VLo炸场！生图编辑吊打GPT-4o？网友：真香！

2025-06-30 09:39:44

嘿，朋友们！阿里Qwen-VLo来搞事情了！

要说最近科技圈啥最火？那必须是AI生图啊！这不，阿里昨儿晚上带着他们家新出的多模态模型Qwen-VLo就来“炸场子”了！

如何体验阿里多模态模型Qwen-VLo？

体验地址：【通义千问官网】 --首页--选择模型Qwen3-235B-A22B

阿里多模态模型Qwen-VLo实际案例操作

据说，这玩意儿在原有的基础上，把多模态理解和生成能力直接拉满，三大亮点让你直呼内行：

细节控福音：细节捕捉能力杠杠的，生成过程中语义一致性保持得贼高！
P图小白救星：一个指令就能搞定图像编辑，风格随便换，素材想加就加，文字想添就添！
国际范儿：中英等多语言支持，全球的小伙伴都能轻松上手！

更厉害的是，Qwen-VLo在输入输出上完全不挑剔，分辨率、长宽比随你玩，不受任何限制！

官方还放出了各种Demo，除了GPT-4o那些已经玩烂的（比如连续生成、吉卜力风格、加文字），它还支持各种天马行空的玩法！

比如，想让它像“连续剧”一样生成各种符合你要求的图片，那完全没问题：

更骚的是，你可以像在超市购物一样，让Qwen-VLo生成一张“洗浴用品都在购物篮里”的图片！

结果，Duang~的一下，它就给你安排上了(⊙ˍ⊙)：

虽然还有点小瑕疵，但不得不说，它的“理解”能力确实比以前强了不少！

而且，这种理解能力不仅体现在图像生成上，还能用来识别和解释图像！

比如，生成完图片后，让它介绍一下图中小猫小狗的品种，它也能准确识别出来（虎斑猫和比格）：

更牛的是，Qwen-VLo还能对现有信息进行注释，比如检测和分割图像中的物体。

就像下面这张图，它就用红色Mask成功分割出了香蕉的边缘：

目前，这个模型人人都能免费玩（当前是预览版），认准Qwen3-235B-A22B，直接在首页输入你的需求就行啦！

话不多说，赶紧上手实测一波！

Qwen-VLo，你的编辑能力到底有多强？

根据官方介绍，Qwen-VLo的亮点在于“强细节捕捉”和“一句话编辑图像”，所以咱们这次的测试重点就是它的各种编辑能力。

毕竟，这玩意儿真的太吸引人了！

你想啊，现在AI生图都跟抽卡一样，好不容易生成一张差不多的，结果还不完全满意，这时候二次/多次编辑就显得尤为重要了。

而且，编辑能力强，真的能给P图废材省不少事儿啊……

先来点开胃小菜！

第一测，让它先生成一张北极熊喝可乐的照片，走的是非现实风格。

然后，直接跟它说把可乐换成牛奶。

一次成功！Qwen-VLo真的把可乐换成了牛奶，而且背景和北极熊都没怎么改动。

硬要挑刺的话，就是北极熊的眉眼和毛发质感稍微有点不一样。

第二测，让它帮忙生成一张小鸟的照片，这次走现实摄影风格。

然后，不用去霍格沃茨，直接说“把图中的这只鸟换成鸽子”，就能施展魔法：

但是，当我们尝试玩“蒜鸟”的梗时，Qwen-VLo就没get到。

（“蒜鸟”是最近爆火的一个梗，谐音“算了算了，都不容易”）

不过，虽然没get到梗，Qwen-VLo还是努力完成了编辑任务，在不改变其他元素的基础上，把图中的鸽子换成了另一种鸟：

也算是一种换鸟了？

第三测，来个多步骤任务，全方位测试Qwen-VLo“描绘”世界的能力，重点考察它在图像上的文本编辑能力。

过程是「让Qwen-VLo生成草图——上色——加字——编辑汉字」。

咱们连着看过程中顺次截取的四张图，感受它每一步带来的改变：

虽然图里小帅哥的五官一直在变，但人物主体稳定，背景没变，编辑汉字的任务完成得还不错。

最后来个附加题，编辑英文——

字编辑对了，人物主体位置没变，背景依旧，总体没啥问题。

但小帅哥也变得有点美漫风了（手动笑死）。

同样是逐步展示，Qwen-VLo这背后是真的有东西

这里咱们再补充一点，大家上手玩的时候应该都注意到了。

Qwen-VLo生成图像的过程是这样的——

是不是有点眼熟？

没错，GPT-4o也是从上到下逐块生成图像的：先显示模糊轮廓，再逐步填充细节。

不过，有研究表明，用户看到的逐行渲染效果只是OpenAI的障眼法，并不是真的逐像素生成。

这样做既满足了用户对“实时生成”的心理预期，又避免了真正的技术负担。

但Qwen这么做就不是演戏了。

敲黑板——

Qwen官方表示，Qwen-VLo的这种渐进式生成方式，不仅是从上到下，还是从左至右逐步清晰地构建整幅图片。

（虽然我们没肉眼观察到“从左至右”的效果，但“从上到下”是肯定有的）

更重要的是，Qwen引入这个形式，它是真的有用啊：

在生成过程中，模型会对预测的内容不断调整和优化，从而确保最终结果更加和谐一致。这种生成机制不仅提升了视觉效果，还特别适用于需要精细控制的长段落文字生成任务。

比如，在生成带有大量文本的广告设计或漫画分镜时，Qwen-VLo会逐步生成，慢慢修改。

这个生成过程，其实有点像思维链“一步一步慢慢想”的具象化！

网友脑洞大开，一起来看看！

除了我们的实测，还有很多网友贡献了一波有趣的玩法…

随便一张动漫角色草图， Qwen-VLo就能帮你一键上色。

让小猫担任宣传员，还能直接生成带有“Qwen Chat”字样的看板。

或者也可以借鉴下面网友的做法，以后用来制作一些梗图（doge）。

顺便提一句，连Qwen团队成员Binyuan Hui都出来给大家打样，分享了吉卜力风格的某近日顶流。

好了，更多例子就不一一展示了，就一句话：

模型现在免费开放，快去体验一把，别忘了回来分享你的作品！

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码：

AITOP100平台大赛社群二维码

0

0

文章来源：AI TOP100

免责声明：本文不代表本平台立场，且不构成投资建议，请谨慎对待。

全部评论

暂无评论

相关AI工具

通义千问

热点资讯

每日AI资讯-2026年7月06日

每日AI资讯-2026年7月06日

每日AI资讯-2026年7月03日

每日AI资讯-2026年7月03日

AI内容共创计划6月奖励公示｜88篇投稿、22.98万次浏览量创新高！新人专属扶持重磅加码

AI内容共创计划6月奖励公示｜88篇投稿、22.98万次浏览量创新高！新人专属扶持重磅加码

每日AI资讯-2026年7月08日

每日AI资讯-2026年7月08日

AIGC大赛：懂车帝车影像AI创作大赛，奖金100万

AIGC大赛：懂车帝车影像AI创作大赛，奖金100万

分享

0

0

欢迎来到AI Top100！我们聚合全球500+款AI智能软件，提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台，让您轻松了解全球AI领域动态，并为您提供优质服务。

合作伙伴

联系我们

加入AITOP100社群

加入社群

AITOP100商务微信

商务微信

相关链接

服务及隐私政策