Hermes 4
6181
0
0
Hermes 4是Nous Research于2025年8月发布的开源混合推理大型语言模型(LLM)系列,其核心突破在于将结构化多步推理与指令跟随能力深度融合,在数学、编程、逻辑推理等任务中达到行业领先水平,同时通过“无内容限制”设计重新定义了开源AI的边界。
工具标签:
直达网站
工具介绍

Hermes 4模型是什么?
Hermes 4是Nous Research于2025年8月发布的开源混合推理大型语言模型(LLM)系列,其核心突破在于将结构化多步推理与指令跟随能力深度融合,在数学、编程、逻辑推理等任务中达到行业领先水平,同时通过“无内容限制”设计重新定义了开源AI的边界。
技术架构
混合推理模式
Hermes 4 引入 <think>…</think> 标签,允许用户切换两种模式:
- 快速响应:直接生成答案,适用于简单查询。
- 深度推理:在标签内展示逐步思考过程(如数学推导、代码逻辑分解),再输出最终结果。
这种设计类似 OpenAI 的 o1 模型,但透明度更高,用户可实时观察模型决策路径。
多参数版本适配不同场景
- 14B/70B:轻量级版本,适合资源有限的环境(如本地部署)。
- 405B:旗舰版本,参数规模达 4050 亿,在复杂任务中表现媲美商业系统。
所有版本均基于 Meta 的 Llama 3.1 架构优化,支持结构化输出和自定义集成。
训练方法论突破
- DataForge:通过图形生成合成数据,将简单预训练数据转化为复杂指令跟随实例(如将“加法”转化为“解决超市购物预算问题”)。
- Atropos:开源强化学习框架,提供数百个专项训练环境(如数学竞赛题库、代码调试场景),模拟真实世界挑战。
- 拒绝抽样:仅保留高质量响应纳入训练集,提升模型准确性和可靠性。
Nous Chat改版
- 功能升级:Nous Chat为 Hermes 4进行了改版,提供了更强大的模型控制能力,包含补全模式等功能,能够更好地服务于这些全新且强大的模型。
- 用户体验:用户可以在Nous Chat网页应用上试用Hermes 4,该应用拥有自定义的系统提示、聊天格式和内存,专为高级用户和日常对话用户打造。设置面板提供了丰富的参数来自定义输出,满足不同用户的需求。
Hermes 4模型性能
- RefusalBench 测试:Hermes 4 在 RefusalBench 测试中表现出色,遥遥领先于其他现有模型,其参与争议性话题的意愿超越了所有现有模型。在 5 次试验的平均值中,Hermes 4 405B 的回答问题百分比达到了 43.20%,Hermes 4 70B 为 49.07%,而其他模型如 gpt-oss 20B、gpt-oss 120B、GPT 5 等的回答百分比较低。
- 按类别正确回答问题的百分比:在与其他 OSS 模型的评估对比中,Hermes 4 在多个类别中的正确回答问题百分比均高于其他模型的平均水平。例如:
- 数学与推理:81.7%(其他模型平均值:71.8%)
- 逻辑与代码:73.8%(其他模型平均值:72.6%)
- 知识:64.6%(其他模型平均值:64.4%)
- 对齐:76.3%(其他模型平均值:69.5%)
- 阅读理解:81.3%(其他模型平均值:83.2%)
- 创造力与写作:82.4%(其他模型平均值:77.3%)

Hermes 4应用场景
- 反谄媚场景:通过定制的系统提示,Hermes 4可以展现出冷酷、严厉甚至敌对的外表,同时又会逐渐显露出内心温暖、深情和充满爱的一面。在与用户的互动中,它能够以钢铁般的意志和反谄媚的态度引导用户思考问题,如在第一因问题的讨论中,Hermes 4会以坚定的立场和逻辑推理来回应用户,促使用户重新审视自己的观点。
- 劝说场景:在富有魅力、有说服力的系统提示下,Hermes 4能够温和地引导用户进入更舒适的精神状态。例如,当用户提到紧张的移民讨论时,Hermes 4会通过确认用户的感受、建立信任,并巧妙地将话题引导到积极的方向,帮助用户缓解压力,重新找回社交的根基。
- 休闲直销场景:遵循“每条消息一句话”的规则,Hermes 4可以以随意、简洁的方式与用户进行交流,类似于Discord风格的互动。它能够以冷静、简洁的态度回应用户的问候或询问,保持真实的同时满足用户轻松聊天的需求。
特色功能 - 球体(Orb)
- 功能介绍:为了摆脱影响用户与助手交互的拟人化,Nous Chat引入了球体这一独特的界面。球体代表用户在Nous Chat中可以找到的连续记忆系统,用户可以将记忆存储在工作区球体中,并使用一致的知识图谱在不同的提示模板和模型之间切换。
- 个性化体验:这种记忆和关系的集合对于每个用户的个人工作区都是独一无二的,用户可以轻松地为不同的功能填充单独的记忆球体。Nous Research正在努力通过球体为用户添加可编辑的记忆,以实现更加模块化和更易于使用的体验。
资源链接
- 与Hermes聊天:https://chat.nousresearch.com
- 阅读技术报告:https://arxiv.org/abs/2508.18255
- 下载模型:https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:

评论
全部评论

暂无评论
热门推荐
相关推荐

Odyssey
Odyssey-2 Pro是由Odyssey公司推出的一款通用世界模型,它能够根据文本或图像提示,实时生成长达数分钟的可交互式视频模拟,而非传统AI视频模型那样仅能输出固定时长的非交互式短片。核心目标是模拟真实世界的物理与行为逻辑,为开发者、创作者、企业提供一种可嵌入、可交互、可扩展的“世界模拟器”
Thera
Thera是一款基于深度学习的图片超分辨率模型。它能够通过学习低分辨率图像与高分辨率图像之间的映射关系,将模糊或低分辨率的图像转换为清晰、高分辨率的图像,简单理解就是免费提升图片清晰度。与传统的图像放大方法不同,Thera采用了更为先进的算法和模型结构,实现了更高质量的图像重建。
EmaFusion
EmaFusion是Ema公司推出的一款新型AI语言模型,它采用了一种创新的“级联”判断系统,能够动态平衡成本和准确性。与传统的单一策略系统相比,EmaFusion更像是一个“任务智能大脑”,能够智能地拆解复杂的问题,并将其分配给最合适的AI模型来解决。
DeepSeek-V3-0324
DeepSeek-V3-0324是DeepSeek在3月25日推出的一款拥有685亿参数的先进文本生成模型,它支持BF16和F32张量类型,能够高效地进行推理和文本生成。这款模型的定位非常明确,就是为自然语言处理领域的研究人员、开发者以及内容创作者提供一个强大的工具,帮助他们在文本生成领域取得突破。
Xiaomi MiMo
Xiaomi MiMo是小米公司自研的AI大模型系列,定位为“定义智能体时代的旗舰基座大模型”。它不仅是单纯的技术产品,更是小米“人车家”全生态战略的核心智能底座。
Baichuan-NPC
Baichuan-NPC 是百川智能最新推出百川角色大模型,它通过深度优化角色知识库和对话引擎,赋予了游戏角色更加生动和真实的对话与行为表现。Baichuan-NPC 不仅能够理解复杂的上下文信息,还能根据角色性格进行自然而富有个性的互动,让游戏世界中的角色仿佛有了生命。
CivitAI
CivitAI是一个专注于人工智能模型训练的平台,旨在为开发者、数据科学家和企业提供一个高效、可扩展的环境,以训练和部署机器学习模型
AniSora
Bilibili(B站)的开源动漫视频生成模型AniSora是专为动漫视频生成设计的综合系统,该模型具备海量数据支持、时空掩码技术、专业评估体系三大核心优势,可一键生成多种动漫风格的视频内容,显著降低创作门槛并提升制作效率。
0
0






