2026年6月2日,阿里通义千问正式发布Qwen3.7-Plus多模态交互混合智能体,这款以视觉-语言一体化、GUI+CLI双端通吃、端到端自主开发为核心的大模型,一经亮相便在权威视觉榜单Vision Arena拿下全球前五、中国第一的成绩,彻底改写多模态AI与AI编程的竞争格局。
不同于传统大模型"能说不能做、能看不会写"的短板,Qwen3.7-Plus把看、想、写、做、验五大能力塞进一套闭环智能体架构,从前端原型到复杂软件工程,真正实现无人干预的全链路自动化。
模型地址:通义千问官网

一、核心定位:不止是大模型,是能动手干活的多模态智能体
Qwen3.7-Plus不是简单的版本迭代,而是Qwen3.7文本能力+全域视觉能力的深度融合,定位为一体化智能体基座。
它的核心突破,是把两种完全不同的交互模式无缝打通:
- GUI(图形界面):看懂UI、操作APP、复刻界面、视频理解
- CLI(命令行):终端执行、代码编译、环境配置、批量运维
两种能力在同一智能体循环中协同,不用切换模型、不用人工中转,直接完成从需求到上线的完整工作流。
简单说:以前AI是"助手",现在Qwen3.7-Plus是能独立负责项目的全栈工程师。
二、硬核技术:三大能力维度,参数与实测全部拉满
官方公布的评测与技术细节显示,Qwen3.7-Plus在纯文本推理、多模态视觉编程、真实世界感知三大方向均达到Plus级头部水平。
1. 纯文本与推理Agent:编程与科研双强
作为AI编程与科学计算的核心底座,它在多项权威基准中表现突出:
- Terminal Bench2.0:复杂终端任务稳定输出,长时程不掉线
- SWE-bench / SWE-Bench Pro:工程级代码任务领先,接近Max级水准
- SciCode:科学编程、公式推导、数值计算能力拉满
- GPQA Diamond:高难度STEM推理,稳居Plus模型第一梯队
这意味着:无论是后端逻辑、算法实现、脚本编写,还是论文公式、科研代码,它都能独立完成、自主调试。
2. 多模态推理与视觉编程:看图写代码,一键还原界面
这是Qwen3.7-Plus最颠覆的能力——把图像/视频/UI截图直接转可执行代码。
- 空间建模与路径搜索大幅优化,BabyVision成绩显著提升
- 支持SVG高精度还原、交互式网页生成、UI稿转前端代码
- 可解析设计图、APP截图、网页原型,自动输出可运行源码
对前端/客户端开发者来说:以后一张截图,就能生成可直接编译的页面代码,效率直接翻倍。
3. 真实世界感知与视频理解:文档、OCR、动态场景全搞定
- 高精度文档解析+高级OCR,复杂排版、表格、公式全覆盖
- 长短视频事件流理解,精准捕捉时序与空间关系
- LingoQA等驾驶场景评测,对动态目标、空间关系判断精准
不管是办公文档、监控视频、行车画面,还是复杂界面操作,它都能看懂、理解、执行。
三、全球排名:Vision Arena权威认证,中国模型首次登顶视觉前五
在全球最具公信力的多模态视觉竞技场Vision Arena中,Qwen3.7-Plus凭借综合视觉能力,帮助阿里实验室跻身:
- 全球前五
- 中国第一
同台对手包括Anthropic Claude Opus系列、OpenAI GPT系列、Google Gemini系列,Qwen3.7-Plus是唯一进入第一梯队的国产多模态模型。

四、炸裂实测:3大真实场景,AI自主闭环不掺水
官方同步放出的实测案例,没有Demo式演示,全是可复现、可落地的真实业务场景。
1. 11小时无人工干预,完整开发一款英语单词学习APP
基于Qwen3.7-Plus的Hybrid-Agent系统:
- 连续稳定运行11小时+
- 自主触发工具调用超1000次
- 生成代码超10000行
- 全程无人介入,完成需求→开发→测试→部署全闭环
这是目前公开信息中,少有的超长时程、全自主、工程级APP开发案例。
2. 高保真复刻macOS原生股市应用,10项测试全过
- 自主交互macOS原生"股市"App,理解布局与交互逻辑
- 自动编写SwiftUI源码,接入真实行情API
- 完美还原暗色主题、交互逻辑、视觉样式
- 10项功能验证全部通过,与原生体验几乎无差别
3. 云控制台无人值守运维,普通人也能秒变运维工程师
配套Qwen for Chrome插件:
- 听懂自然语言需求,不用懂命令、不用懂配置
- 自主登录阿里云控制台,完成ECS比价、选型、配置、购买
- 自主处理停机、扩容、升级等复杂运维操作
- 非专业用户也能安全、高效完成云资源管理
五、技术架构与部署优势:跨框架泛化,稳定不挑环境
Qwen3.7-Plus采用统一智能体循环架构,把感知、推理、执行、验证整合到一套机制里,解决传统AI长链路任务易崩溃、易遗忘的问题。
部署层面极度友好:
- 支持Claude Code、OpenClaw、Qwen Code等主流框架
- 跨框架泛化表现稳定,不挑环境、不挑脚手架
- 已通过阿里云百炼、Qwen Studio正式开放服务
- 为具身智能、生产力自动化、企业级Agent提供坚实基座
六、总结:AI开发进入"自主闭环"时代,国产模型领跑
Qwen3.7-Plus的发布,标志着多模态AI从"理解时代"正式进入"执行时代":
- 能看界面、能写代码、能操作系统、能自我验证
- 超长时程稳定运行,真正替代人工完成复杂工程任务
- 全球权威榜单认证,中国大模型在多模态赛道实现关键领跑
对开发者、产品经理、运维人员、企业IT团队而言,这不是一次技术升级,而是生产方式的重构——以后从想法到产品,中间的重复劳动,都可以交给AI自主完成。
Qwen3.7-Plus已经开放使用,感兴趣的开发者可以通过阿里云百炼与Qwen Studio体验,感受11小时全自动开发APP的真实效率。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










