阿里开源新突破：Qwen3-Next-80B-A3B模型，性能效率双飞跃-AITOP100,AI资讯

在人工智能生成内容（AIGC）领域，各大科技巨头都在你追我赶，不断推出新技术、新模型。2025年9月11日，阿里巴巴凭借其开源的最新架构模型Qwen3-Next-80B-A3B，在AIGC赛道上又迈出了坚实且关键的一步，引发了行业内外的广泛关注。

Qwen3-Next-80B-A3B

参数与成本：小参数大能量，成本大幅降低

Qwen3-Next拥有800亿的总参数规模，这一数字看似庞大，但在实际推理过程中，它仅激活30亿参数。这种独特的设计带来了显著的成本优势。与前代产品Qwen3-32B相比，Qwen3-Next的训练成本大幅下降了90%。这意味着在相同的资源投入下，企业或开发者能够进行更多次数的训练，探索更多可能性，极大地降低了进入AIGC领域的门槛。

推理效率：速度飙升，长文本处理优势尽显

推理效率的提升是 Qwen3-Next 的一大亮点。它的推理效率相较于前代提升了 10 倍，特别是在处理超长文本（32K 以上）时，表现尤为突出。

在执行指令和处理长上下文任务时，Qwen3-Next 展现出了与阿里旗舰模型 Qwen3-235B 相媲美，甚至超越谷歌最新 Gemini-2.5-Flash思考模型的实力。无论是处理复杂的文章摘要、长对话生成，还是其他涉及大量文本信息的任务，Qwen3-Next 都能快速且准确地完成，为用户节省了大量时间。

Qwen3-Next-80B-A3B

核心创新：混合专家架构，攻克长上下文难题

Qwen3-Next 的核心创新在于其采用的 混合专家架构，通过将门控 DeltaNet 和门控注意力相结合，成功克服了传统注意力机制在处理长上下文时的不足。传统注意力机制在面对长文本时，往往会出现计算量过大、效率低下等问题，而 Qwen3-Next 的这种创新设计，在保证处理速度的同时，显著提升了上下文学习能力。就好比一个人在阅读一篇长文章时，能够快速抓住关键信息，理解文章的核心内容，而不会被繁琐的细节所困扰。

此外，模型在训练过程中采用了 高稀疏性 MoE 结构。这种结构能够在不影响性能的前提下，最大化地利用资源。简单来说，它就像是一个高效的资源分配者，将有限的资源集中分配到最需要的地方，避免了资源的浪费，从而在保证模型性能的同时，降低了训练成本。

多token预测机制：投机解码表现更优

除了上述创新，Qwen3-Next还引入了 多token预测机制。这一机制的加入，进一步提升了模型在投机解码中的表现。在预训练阶段，Qwen3-Next的效率相较于Qwen3-32B有了显著提高，训练成本仅为其9.3%，但性能却更胜一筹。

在推理速度方面，处理长文本时，Qwen3-Next的吞吐量相比Qwen3-32B提升了7倍，即使在更长的上下文中，依然能保持 10倍 的速度优势。这意味着在实际应用中，Qwen3-Next能够更快地生成结果，满足用户对高效处理的需求。

行业影响：技术突破获广泛关注

阿里的这一新模型不仅在技术上取得了重大突破，也赢得了开发者和研究人员的一致好评。在竞争激烈的AIGC领域，技术创新是企业保持竞争力的关键。Qwen3-Next 的出现，为行业树立了新的标杆，展示了阿里巴巴在人工智能领域的强大实力和创新能力。无论是对于想要探索AIGC应用的企业，还是专注于人工智能研究的专业人士，Qwen3-Next都提供了一个极具价值的工具和平台。

在线体验：通义千问大模型地址

模型地址： https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码：