• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

阿里Qwen-VLo炸场!生图编辑吊打GPT-4o?网友:真香!

阿里Qwen-VLo炸场!生图编辑吊打GPT-4o?网友:真香!
AI TOP100
2025-06-30 09:39:44

嘿,朋友们!阿里Qwen-VLo来搞事情了!

要说最近科技圈啥最火?那必须是AI生图啊!这不,阿里昨儿晚上带着他们家新出的多模态模型Qwen-VLo就来“炸场子”了!

如何体验阿里多模态模型Qwen-VLo?

体验地址:【通义千问官网】 --首页--选择模型Qwen3-235B-A22B

Qwen-VLo

阿里多模态模型Qwen-VLo实际案例操作

据说,这玩意儿在原有的基础上,把多模态理解和生成能力直接拉满,三大亮点让你直呼内行:

  • 细节控福音:细节捕捉能力杠杠的,生成过程中语义一致性保持得贼高!
  • P图小白救星:一个指令就能搞定图像编辑,风格随便换,素材想加就加,文字想添就添!
  • 国际范儿:中英等多语言支持,全球的小伙伴都能轻松上手!

更厉害的是,Qwen-VLo在输入输出上完全不挑剔,分辨率、长宽比随你玩,不受任何限制!

官方还放出了各种Demo,除了GPT-4o那些已经玩烂的(比如连续生成、吉卜力风格、加文字),它还支持各种天马行空的玩法!

比如,想让它像“连续剧”一样生成各种符合你要求的图片,那完全没问题:

AI生成柴犬

更骚的是,你可以像在超市购物一样,让Qwen-VLo生成一张“洗浴用品都在购物篮里”的图片!

结果,Duang~的一下,它就给你安排上了(⊙ˍ⊙):

AI生成洗发露

虽然还有点小瑕疵,但不得不说,它的“理解”能力确实比以前强了不少!

而且,这种理解能力不仅体现在图像生成上,还能用来识别和解释图像!

比如,生成完图片后,让它介绍一下图中小猫小狗的品种,它也能准确识别出来(虎斑猫和比格):

AI生成狗狗头像

更牛的是,Qwen-VLo还能对现有信息进行注释,比如检测和分割图像中的物体。

就像下面这张图,它就用红色Mask成功分割出了香蕉的边缘:

AI生成摆满水果桌面

目前,这个模型人人都能免费玩(当前是预览版),认准Qwen3-235B-A22B,直接在首页输入你的需求就行啦!

Qwen3-235B-A22B

话不多说,赶紧上手实测一波!

Qwen-VLo,你的编辑能力到底有多强?

根据官方介绍,Qwen-VLo的亮点在于“强细节捕捉”和“一句话编辑图像”,所以咱们这次的测试重点就是它的各种编辑能力。

毕竟,这玩意儿真的太吸引人了!

你想啊,现在AI生图都跟抽卡一样,好不容易生成一张差不多的,结果还不完全满意,这时候二次/多次编辑就显得尤为重要了。

而且,编辑能力强,真的能给P图废材省不少事儿啊……

猫咪思考头像

先来点开胃小菜!

第一测,让它先生成一张北极熊喝可乐的照片,走的是非现实风格。

AI生成北极熊喝可乐

然后,直接跟它说把可乐换成牛奶。

AI生成北极熊喝牛奶

一次成功!Qwen-VLo真的把可乐换成了牛奶,而且背景和北极熊都没怎么改动。

硬要挑刺的话,就是北极熊的眉眼和毛发质感稍微有点不一样。

第二测,让它帮忙生成一张小鸟的照片,这次走现实摄影风格。

AI生成小鸟

然后,不用去霍格沃茨,直接说“把图中的这只鸟换成鸽子”,就能施展魔法:

Ai生成鸽子

但是,当我们尝试玩“蒜鸟”的梗时,Qwen-VLo就没get到。

(“蒜鸟”是最近爆火的一个梗,谐音“算了算了,都不容易”)

不过,虽然没get到梗,Qwen-VLo还是努力完成了编辑任务,在不改变其他元素的基础上,把图中的鸽子换成了另一种鸟:

AI生成小鸟

也算是一种换鸟了?

蒜鸟

第三测,来个多步骤任务,全方位测试Qwen-VLo“描绘”世界的能力,重点考察它在图像上的文本编辑能力。

过程是「让Qwen-VLo生成草图——上色——加字——编辑汉字」。

咱们连着看过程中顺次截取的四张图,感受它每一步带来的改变:


动漫人物草图



虽然图里小帅哥的五官一直在变,但人物主体稳定,背景没变,编辑汉字的任务完成得还不错。

最后来个附加题,编辑英文——

动漫人物

动漫人物

动物人物

动物人物


字编辑对了,人物主体位置没变,背景依旧,总体没啥问题。

但小帅哥也变得有点美漫风了(手动笑死)。

同样是逐步展示,Qwen-VLo这背后是真的有东西

这里咱们再补充一点,大家上手玩的时候应该都注意到了。

Qwen-VLo生成图像的过程是这样的——

AI生成背景图

是不是有点眼熟?

没错,GPT-4o也是从上到下逐块生成图像的:先显示模糊轮廓,再逐步填充细节。

不过,有研究表明,用户看到的逐行渲染效果只是OpenAI的障眼法,并不是真的逐像素生成。

这样做既满足了用户对“实时生成”的心理预期,又避免了真正的技术负担。

但Qwen这么做就不是演戏了。

敲黑板——

Qwen官方表示,Qwen-VLo的这种渐进式生成方式,不仅是从上到下,还是从左至右逐步清晰地构建整幅图片。

(虽然我们没肉眼观察到“从左至右”的效果,但“从上到下”是肯定有的)

AI生成小熊

更重要的是,Qwen引入这个形式,它是真的有用啊:

在生成过程中,模型会对预测的内容不断调整和优化,从而确保最终结果更加和谐一致。 这种生成机制不仅提升了视觉效果,还特别适用于需要精细控制的长段落文字生成任务。

比如,在生成带有大量文本的广告设计或漫画分镜时,Qwen-VLo会逐步生成,慢慢修改。

这个生成过程,其实有点像思维链“一步一步慢慢想”的具象化!

网友脑洞大开,一起来看看!

除了我们的实测,还有很多网友贡献了一波有趣的玩法…

随便一张动漫角色草图, Qwen-VLo就能帮你一键上色。

Qwen-VLo

让小猫担任宣传员,还能直接生成带有“Qwen Chat”字样的看板。

Qwen-VLo

或者也可以借鉴下面网友的做法,以后用来制作一些梗图(doge)。

Qwen-VLo

顺便提一句,连Qwen团队成员Binyuan Hui都出来给大家打样,分享了吉卜力风格的某近日顶流。

Qwen-VLo

好了,更多例子就不一一展示了,就一句话:

模型现在免费开放,快去体验一把,别忘了回来分享你的作品!


想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

AITOP100平台大赛社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 通义千问
相关资讯
  • AutoClip:开源免费AI视频剪辑工具完全使用指南 - 自动化视频处理的革命性解决方案

  • Kimi K2 Turbo再突破!输出速度飙至每秒100 Tokens,效率翻倍还享5折优惠

  • 即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!

  • AI旅游助手的智能进化:从"出行工具"到"贴心管家"的蜕变之路

  • 腾讯元宝接入DeepSeek V3.1:速度翻倍、智能升级,AI助手迎来新标杆!

热点资讯

即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!

1天前
即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!

DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界

4天前
DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界

可灵2.1首尾帧功能炸场!影视级转场+复杂运镜,一键解锁创作自由!

1天前
可灵2.1首尾帧功能炸场!影视级转场+复杂运镜,一键解锁创作自由!

AITOP100 AI应用重磅更新!Veo3、即梦AI 3.0、Vidu Q1、海螺AI、Luma全新升级

3天前
AITOP100 AI应用重磅更新!Veo3、即梦AI 3.0、Vidu Q1、海螺AI、Luma全新升级

DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析

4天前
DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有