企业级智能体的竞争,正在从“能不能完成任务”,进入“能不能低成本、稳定地完成任务”。
公开报道显示,百度旗下企业级通用智能体产品“百度搭子 DuMate”完成核心引擎升级。此次升级通过 Harness 引擎及多项工程层面的持续调优,在保障 Agent 智能能力与任务执行效果不受影响的前提下,将任务执行过程中的 Token 消耗降低 75%,对应用户积分消耗也相应减少 75%。
这条消息真正值得关注的地方,不只是“成本降了”,而是说明通用智能体产品正在把优化重点从模型能力本身,延伸到任务编排、执行链路、沙箱环境和推理成本控制。
换句话说,Agent 的下半场,不只拼智商,也拼单位任务的算力效率。

01 成本下降 75%,为什么重要?
对普通聊天机器人来说,单次问答的 Token 消耗并不总是用户最敏感的问题。但对企业级智能体来说,情况完全不同。
因为 Agent 往往不是回答一句话,而是执行一串任务:理解目标、拆解步骤、调用工具、检索资料、运行代码、生成文档、校验结果。每一步都可能消耗 Token、计算资源和调用成本。
因此,同样一个任务,如果执行链路更短、工具调用更准、上下文管理更高效,最终就会直接反映到用户成本和产品毛利上。
DuMate 这次把“同任务 Token 消耗降低 75%”放到核心位置,说明 Agent 产品开始从功能展示走向经营效率。

02 Harness 引擎优化的本质:让任务执行更省
公开资料提到,此次升级依托 Harness 引擎及工程优化。
可以把 Harness 理解为智能体执行任务时的“任务编排与运行骨架”:它决定任务如何拆分、何时调用工具、如何管理上下文、怎样在多步骤执行中减少重复计算。
真正的优化,不一定来自单个模型参数变小,而可能来自整条链路的精简:
- 让任务规划更准确,减少无效步骤;
- 让工具调用更精准,减少重复尝试;
- 让上下文压缩更合理,减少无关 Token;
- 让沙箱和工程链路更稳定,减少执行返工。
这也是为什么 Agent 的成本优化,往往是模型、系统和工程的综合题。

03 这对企业用户意味着什么?
如果 75% 的消耗下降能够在更多任务中稳定体现,企业用户会最先感受到三点变化。
第一,试错成本降低。以前不敢频繁跑的复杂任务,现在可以更放心地迭代。
第二,规模化门槛降低。企业级 Agent 一旦进入团队协作和流程自动化,成本会从单次调用变成长期预算。
第三,产品体验更可持续。用户积分消耗下降,意味着同样预算下可以完成更多任务,也更容易形成持续使用习惯。
这对智能体产品来说很关键:只有成本可控,Agent 才能从演示场景走向真实生产流程。
04 但“成本大降”不等于所有任务都一样降
这里需要保持谨慎。
公开报道中的 75% 降幅,指向的是特定口径下的任务执行 Token 消耗和用户积分消耗下降。不同任务的复杂度、工具调用次数、上下文长度、资料质量和输出要求不同,实际节省幅度可能存在差异。
因此,更稳妥的理解是:DuMate 的核心引擎升级,为降低通用智能体执行成本提供了一个重要样本,但具体到企业实际使用,仍需要看任务类型、工作流设计和真实运行数据。

05 一句话结论
百度 DuMate 的这次引擎优化,把 Agent 竞争的关键指标往前推了一步:不只是“能不能做”,还要看“做一次要花多少算力”。
当 Token 消耗、积分成本、工具链效率和执行稳定性成为用户可感知的指标,企业级智能体的竞争也会从能力展示转向效率经营。
未来真正能跑进企业工作流的 Agent,一定不是只会“炫技”的产品,而是能在效果、成本和稳定性之间取得平衡的系统。








