腾讯混元Turbo S模型:AI领域的重大进展
2025年2月27日,腾讯重磅发布新一代混元快思考模型——Turbo S,这标志着大模型技术在响应速度和性能优化上实现了关键性突破。相较于Deepseek R1和混元T1等传统慢思考模型,混元Turbo S实现了惊人的“秒回”速度,大大缩短了答案输出时间,吐字速度提升一倍,首字时延降低44%。这一创新让模型在知识理解、数理运算、内容创作等多个领域表现卓越,为大模型的快速响应能力问题提供了全新的解决方案。
混元Turbo S的设计理念源自人类日常决策中占比高达90%~95%的直觉式快思考模式。通过将这种快思考与理性分析的慢思考模式巧妙融合,模型具备了更智能、更高效的问题解决能力。这种长短思维链的结合,不仅保证了文科问题处理的快速体验,还显著增强了理科推理能力,从而使整体性能得到显著提升。在多个业界通用的公开Benchmark测试中,混元Turbo S展现出与DeepSeek V3、GPT4o、Claude等领先模型旗鼓相当的强大实力。

架构创新:Hybrid-Mamba-Transformer融合
在架构层面,混元Turbo S创新性地采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度以及KV-Cache缓存占用,进而显著降低了训练和推理成本。这种混合架构成功突破了传统大模型在长文本训练和推理中成本高昂的瓶颈,充分发挥了Mamba架构在处理长序列方面的优势,同时保留了Transformer架构捕捉复杂上下文信息的能力,成为工业界首次成功将Mamba架构无损应用于超大型MoE模型的典范。
作为腾讯混元系列的核心基石,混元Turbo S未来将为推理、长文、代码等多种衍生模型提供强大的基础能力支撑。基于Turbo S,腾讯还推出了具备深度思考能力的推理模型T1,该模型已在腾讯元宝APP上全面部署,并将很快通过API接口对外提供服务。
限时免费试用与大幅降价
目前,开发者和企业用户已经可以通过腾讯云官网的API接口调用混元Turbo S,并享受为期一周的免费试用优惠。该模型的定价为输入0.8元/百万tokens,输出2元/百万tokens,相较于上一代混元Turbo模型,价格大幅降低。此外,混元Turbo S也将逐步在腾讯元宝APP中灰度上线,用户可以在APP内选择“Hunyuan”模型并关闭深度思考功能进行体验。








