Hermes 4
4827
0
0
Hermes 4是Nous Research于2025年8月发布的开源混合推理大型语言模型(LLM)系列,其核心突破在于将结构化多步推理与指令跟随能力深度融合,在数学、编程、逻辑推理等任务中达到行业领先水平,同时通过“无内容限制”设计重新定义了开源AI的边界。
工具标签:
直达网站
工具介绍

Hermes 4模型是什么?
Hermes 4是Nous Research于2025年8月发布的开源混合推理大型语言模型(LLM)系列,其核心突破在于将结构化多步推理与指令跟随能力深度融合,在数学、编程、逻辑推理等任务中达到行业领先水平,同时通过“无内容限制”设计重新定义了开源AI的边界。
技术架构
混合推理模式
Hermes 4 引入 <think>…</think> 标签,允许用户切换两种模式:
- 快速响应:直接生成答案,适用于简单查询。
- 深度推理:在标签内展示逐步思考过程(如数学推导、代码逻辑分解),再输出最终结果。
这种设计类似 OpenAI 的 o1 模型,但透明度更高,用户可实时观察模型决策路径。
多参数版本适配不同场景
- 14B/70B:轻量级版本,适合资源有限的环境(如本地部署)。
- 405B:旗舰版本,参数规模达 4050 亿,在复杂任务中表现媲美商业系统。
所有版本均基于 Meta 的 Llama 3.1 架构优化,支持结构化输出和自定义集成。
训练方法论突破
- DataForge:通过图形生成合成数据,将简单预训练数据转化为复杂指令跟随实例(如将“加法”转化为“解决超市购物预算问题”)。
- Atropos:开源强化学习框架,提供数百个专项训练环境(如数学竞赛题库、代码调试场景),模拟真实世界挑战。
- 拒绝抽样:仅保留高质量响应纳入训练集,提升模型准确性和可靠性。
Nous Chat改版
- 功能升级:Nous Chat为 Hermes 4进行了改版,提供了更强大的模型控制能力,包含补全模式等功能,能够更好地服务于这些全新且强大的模型。
- 用户体验:用户可以在Nous Chat网页应用上试用Hermes 4,该应用拥有自定义的系统提示、聊天格式和内存,专为高级用户和日常对话用户打造。设置面板提供了丰富的参数来自定义输出,满足不同用户的需求。
Hermes 4模型性能
- RefusalBench 测试:Hermes 4 在 RefusalBench 测试中表现出色,遥遥领先于其他现有模型,其参与争议性话题的意愿超越了所有现有模型。在 5 次试验的平均值中,Hermes 4 405B 的回答问题百分比达到了 43.20%,Hermes 4 70B 为 49.07%,而其他模型如 gpt-oss 20B、gpt-oss 120B、GPT 5 等的回答百分比较低。
- 按类别正确回答问题的百分比:在与其他 OSS 模型的评估对比中,Hermes 4 在多个类别中的正确回答问题百分比均高于其他模型的平均水平。例如:
- 数学与推理:81.7%(其他模型平均值:71.8%)
- 逻辑与代码:73.8%(其他模型平均值:72.6%)
- 知识:64.6%(其他模型平均值:64.4%)
- 对齐:76.3%(其他模型平均值:69.5%)
- 阅读理解:81.3%(其他模型平均值:83.2%)
- 创造力与写作:82.4%(其他模型平均值:77.3%)

Hermes 4应用场景
- 反谄媚场景:通过定制的系统提示,Hermes 4可以展现出冷酷、严厉甚至敌对的外表,同时又会逐渐显露出内心温暖、深情和充满爱的一面。在与用户的互动中,它能够以钢铁般的意志和反谄媚的态度引导用户思考问题,如在第一因问题的讨论中,Hermes 4会以坚定的立场和逻辑推理来回应用户,促使用户重新审视自己的观点。
- 劝说场景:在富有魅力、有说服力的系统提示下,Hermes 4能够温和地引导用户进入更舒适的精神状态。例如,当用户提到紧张的移民讨论时,Hermes 4会通过确认用户的感受、建立信任,并巧妙地将话题引导到积极的方向,帮助用户缓解压力,重新找回社交的根基。
- 休闲直销场景:遵循“每条消息一句话”的规则,Hermes 4可以以随意、简洁的方式与用户进行交流,类似于Discord风格的互动。它能够以冷静、简洁的态度回应用户的问候或询问,保持真实的同时满足用户轻松聊天的需求。
特色功能 - 球体(Orb)
- 功能介绍:为了摆脱影响用户与助手交互的拟人化,Nous Chat引入了球体这一独特的界面。球体代表用户在Nous Chat中可以找到的连续记忆系统,用户可以将记忆存储在工作区球体中,并使用一致的知识图谱在不同的提示模板和模型之间切换。
- 个性化体验:这种记忆和关系的集合对于每个用户的个人工作区都是独一无二的,用户可以轻松地为不同的功能填充单独的记忆球体。Nous Research正在努力通过球体为用户添加可编辑的记忆,以实现更加模块化和更易于使用的体验。
资源链接
- 与Hermes聊天:https://chat.nousresearch.com
- 阅读技术报告:https://arxiv.org/abs/2508.18255
- 下载模型:https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:

评论
全部评论

暂无评论
热门推荐
相关推荐

日日新SenseNova
日日新SenseNova大模型是商汤科技推出的一款综合性人工智能大模型。它基于商汤科技深厚的学术积累和技术研发实力,集成了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种能力。
子曰-o1
“子曰-o1”是网易有道基于多年教育数据和AI技术积累,推出的一款轻量级推理模型。它采用14B的小参数设计,能够在普通消费级显卡上高效部署,专为教育场景设计。该模型利用思维链技术,通过自我对话和纠错机制,在解题时输出详细的思考过程,帮助学生理解解题逻辑,提升学习效果。
紫东太初大模型
紫东太初大模型是由中国科学院自动化研究所与武汉人工智能研究院联合研发,是全球领先的跨模态通用人工智能平台,也是一个千亿参数级别的多模态大模型,它能够实现文本、图像、音频、视频、传感信号和3D点云等多种数据模态的统一表示和互相生成。
讯飞星辰Maas平台
讯飞星辰作为科大讯飞倾力打造的AI大模型定制训练平台,致力于为用户打造独一无二的专属大模型。该平台汇聚了超过20个在行业内广受认可的优质模型,诸如星火大模型、Llama3等,均在其列。更为便捷的是,讯飞星辰支持零代码微调功能,极大地降低了大模型精调的复杂性和门槛。
Qwen Chat
Qwen Chat是阿里通义千问团队推出的一个集成多种Qwen AI大模型的Web UI界面,它为用户提供了一个强大且高效的AI交互平台。该平台基于先进的AI技术,集成了多种Qwen AI大模型,旨在为用户提供丰富多样的功能,以满足不同场景下的需求。
EasyControl
EasyControl是一个在人工智能绘画领域具有创新意义的框架,专为基于 Transformer 架构的扩散模型(DiT)设计,旨在提供高效且灵活的条件控制能力,犹如为DiT模型装上了强大的“ControlNet
Parakeet-TDT-0.6B-V2
Parakeet-TDT-0.6B-V2是英伟达在语音识别技术领域的又一力作,它基于先进的FastConformer架构,并融合了创新的TDT解码器,是一款专注于英文自动语音识别的强大模型。作为Parakeet模型的升级版本,它不仅继承了前代模型的优秀基因,还在性能和功能上实现了重大突破。
Voyager
HunyuanWorld-Voyager是腾讯混元团队于2025年9月2日正式推出全球首个支持原生3D重建的超长漫游世界模型。该模型以“空间一致性”与“长距离探索”为核心突破,在斯坦福大学李飞飞团队主导的WorldScore基准测试中以77.62分的综合成绩登顶榜首,超越谷歌Genie3等开源模型
0
0






