• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作热门-AI社区
AI 对话

阿里通义千问开源Qwen3.6-27B:270亿参数稠密模型,编程能力超越15倍参数量MoE模型

阿里通义千问开源Qwen3.6-27B:270亿参数稠密模型,编程能力超越15倍参数量MoE模型
AI TOP100
1小时前

阿里开源了个270亿参数的模型,编程能力把3970亿参数的MoE甩在身后

4月22日,通义千问团队开源了Qwen3.6-27B。

这个模型有意思的地方在于:它只有270亿参数,却在前代旗舰——总参数3970亿、激活参数17亿的MoE模型Qwen3.5-397B-A17B——的核心能力评测中实现了全面超越。

"以小博大"这件事,在大模型领域并不常见。因为过去几年行业的主流叙事是:参数越大,能力越强。Qwen3.6-27B的出现,让这个线性关系被打破了。

Qwen3.6-27B

一、模型定位:开发者呼声最高的规格

Qwen3.6-27B的定位很明确:开发者群体呼声最高的模型规格。

在它之前,通义千问已经发布了Qwen3.6-Plus和Qwen3.6-35B-A3B两个版本。前者是闭源的高性能模型,后者是开源的轻量级MoE模型。但社区一直有一个诉求:能不能提供一个稠密架构、中等规模、开源可部署的模型?

稠密架构的优势在于:部署简单,不需要MoE路由,推理延迟更稳定。MoE架构的优势是参数大、能力强,但部署复杂度高,需要专门的路由机制。

Qwen3.6-27B就是针对这个需求推出的——270亿参数,稠密架构,开源权重,本地部署友好。让开发者在不需要复杂MoE路由的情况下,也能获得旗舰级的编程辅助体验。

二、参数与架构:270亿稠密多模态模型

项目 规格
总参数量 270亿(27B)
架构类型 稠密模型
模态支持 文本 + 图像 + 视频(原生多模态)
运行模式 思考模式 + 非思考模式
路由需求 无需MoE路由

稠密 vs MoE:稠密模型在推理时会激活所有参数,而MoE(混合专家模型)只会激活部分参数。MoE的优势是用更少的计算量实现更大的参数规模,代价是需要复杂的路由机制。稠密模型的优势是推理逻辑简单、延迟稳定、部署门槛低。

Qwen3.6-27B选择稠密架构,核心考量是降低开发者部署门槛。

三、性能表现:多项基准测试结果

3.1 编程能力基准

Qwen3.6-27B在多项反映真实智能体编程能力的权威基准测试中表现突出:

基准测试 测试内容 表现
SWE-bench Verified 代码修复能力 77.2分
Terminal-Bench 2.0 终端命令执行能力 表现出众
SkillsBench 技能推理任务 进步显著
QwenWebBench Web开发能力 表现出众
NL2Repo 自然语言到代码仓库 表现出众

核心亮点:在所有主要编程基准上,Qwen3.6-27B全面超越了参数量是其15倍的Qwen3.5-397B-A17B。这意味着开发者无需复杂的MoE路由即可获得旗舰级的编程辅助体验。

Qwen3.6-27B

3.2 多模态能力

Qwen3.6-27B原生支持多模态处理:

  • 输入支持:图像 + 视频 + 文本混合输入
  • 应用场景:视觉推理、文档深度理解、交互式视觉问答
  • 能力对标:视觉语言能力与Qwen3.6-35B-A3B保持一致

原文提到,其多模态处理能力已与更高参数级别的Qwen3.6-35B-A3B一致,确保了多模态任务下的高精度产出。

四、部署与生态对接

4.1 获取方式

模型地址: https://www.modelscope.cn/models/Qwen/Qwen3.6-27B

方式 平台 说明
开源权重下载 Hugging Face、ModelScope 支持本地部署
在线体验 Qwen Studio(chat.qwen.ai) 即时交互
API调用 阿里云百炼平台 即将支持

4.2 开发工具集成

Qwen3.6-27B已实现对主流编程助手的无缝集成:

  • Claude Code
  • Qwen Code
  • OpenClaw(类龙虾应用)

这意味着开发者可以把Qwen3.6-27B作为这些编程助手的本地推理引擎,在保持数据隐私的前提下获得高质量的编码辅助。

4.3 特殊功能

阿里云百炼平台将保留"preserve_thinking"功能,以便在智能体任务中完整回溯思维链。这对于需要理解AI推理过程的场景很有价值。

Qwen3.6-27B

五、行业意义:重新审视参数与能力的关系

Qwen3.6-27B的发布,让行业重新审视参数量与能力的线性关系。

过去几年,大模型领域的主流叙事是:参数越大,能力越强。GPT-4、Gemini Ultra、Claude Opus——旗舰模型的参数规模一直在攀升。但Qwen3.6-27B证明了另一条路径:通过训练效率与推理逻辑的重构,中等规模的稠密模型也能在特定任务上达到甚至超越超大参数MoE模型的表现。

有媒体用了一个比喻:这就像是用一台精密的涡轮增压小排量引擎,在赛道上超了一辆笨重的重型卡车。

这种跨层级的性能跃升,本质上是训练效率与推理逻辑的重构。对于开发者来说,这意味着在本地部署的模型,也能完成以往大尺寸或MoE模型才能实现的智能体编程任务。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 魔搭社区
相关资讯
  • 阿里开源Qwen3.6-35B-A3B:30亿激活参数,编程能力"以下犯上"

  • 男子用AI生成假"黄河自杀"照片骗妻子,警方出动后发现是恶作剧

  • 阿里ATH发布Meoo(秒悟):集成四大模型,一分钟生成网站还能自动部署

  • 腾讯开源混元3D世界模型2.0,一键生成可编辑的3D空间

  • MiniMax上线全球首个云端沙箱MaxHermes,AI可以自己"提炼技能"了

热点资讯

炸裂更新!ChatGPT Images 2.0正式上线,AI画图彻底迎来质变时代

1天前
炸裂更新!ChatGPT Images 2.0正式上线,AI画图彻底迎来质变时代

第20届中国好创意大赛-重生纪元恐龙AI创作专项赛

2天前
第20届中国好创意大赛-重生纪元恐龙AI创作专项赛

天猫超市首个AI超市智能体“超喵”正式上线

2天前
天猫超市首个AI超市智能体“超喵”正式上线

腾讯QClaw海外版上线:国内10天百万用户,这次5天就"出海"了

2天前
腾讯QClaw海外版上线:国内10天百万用户,这次5天就"出海"了

地球日·石光奇遇|贵州织金洞·地质保护与全球旅游品牌发布会

1天前
地球日·石光奇遇|贵州织金洞·地质保护与全球旅游品牌发布会
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有