家人们,智谱技术团队最近搞出了大动作!他们不仅开源了32B和9B系列的GLM(通用语言模型)模型,还正式上线了全新的交互体验平台Z.ai。这一系列模型可丰富了,有基座模型、推理模型,还有沉思模型,而且都遵循宽松的MIT许可协议。这意味着啥?开发者用起来可自由了,不仅能免费用于商业用途,还能自由分发呢!
这次开源的32B基座模型GLM - 4 - 32B - 0414,那参数可不少,足足有320亿呢!它是用15T的高质量数据进行预训练的,里面还加入了好多推理类合成数据。在后训练阶段,用了拒绝采样和强化学习这些技术,让这模型在指令遵循、工程代码生成、函数调用这些任务上表现得更棒了。部分Benchmark指标都快赶上甚至超过GPT - 4o、DeepSeek - V3 - 0324(671B)这些大模型了。而且啊,它生成代码的能力也更强了,能处理并生成结构更复杂的单文件代码。Z.ai的对话模式里还有预览功能,能可视化查看生成的HTML和SVG,这样用户评估生成结果和迭代优化就方便多了。
咱再来说说推理模型GLM - Z1 - 32B - 0414。它是在GLM - 4 - 32B - 0414的基础上,用了冷启动与扩展强化学习策略,还针对数学、代码、逻辑这些关键任务进行了深度优化训练。这模型在部分任务上的性能,都能和有671B参数的DeepSeek - R1相媲美了,数理推理能力挺强的,能解决更广泛复杂的任务。更厉害的是,它的实测推理速度能达到200Tokens/秒,是国内目前商业模型里速度最快的,价格还只有DeepSeek - R1的1/30。
9B尺寸的GLM - Z1 - 9B - 0414模型也不逊色。它沿用了上面那些技术,虽然参数少点,但在数学推理和通用任务上表现也不错,整体性能在同尺寸开源模型里算是领先水平。特别是在资源受限的场景下,它能很好地平衡效率和效果,给需要轻量化部署的用户提供了个好选择。
还有个沉思模型GLM - Z1 - Rumination - 32B - 0414,这可是智谱对AGI(通用人工智能)未来形态的新探索。它和一般推理模型不一样,能通过更多步骤的深度思考来解决高度开放和复杂的问题。它的关键创新在于,能在深度思考过程中整合搜索工具处理复杂任务,还运用多种规则型奖励机制来指导和扩展端到端的强化学习训练。这模型支持“自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环,在研究型写作和复杂检索任务上的能力提升了不少。
除了模型开源,基座、推理这两类模型还同步上线了智谱AI MaaS开放平台,给企业和开发者提供API服务。这次上线的基座模型有两个版本:GLM - 4 - Air - 250414和GLM - 4 - Flash - 250414,后面这个完全免费。推理模型有三个版本,能满足不同场景需求。GLM - Z1 - AirX(极速版)定位是国内最快推理模型,推理速度能达到200tokens/秒,比常规快8倍;GLM - Z1 - Air(高性价比版)价格只有DeepSeek - R1的1/30,适合高频调用场景;GLM - Z1 - Flash(免费版)可以免费使用,就是为了降低模型使用门槛。
与此同时,智谱AI启用了全新域名Z.ai。这个平台整合了32B基座、推理、沉思这三类GLM模型,是智谱最新模型的交互体验入口。目前已经上线了三款开源模型,家人们可以在这个平台上免费体验这些模型的强大功能啦!