商汤科技2026年 5 月 8 日正式推出新一代轻量化多模态智能体模型——日日新 SenseNova 6.7 Flash-Lite。该模型采用原生多模态架构,取消传统"视觉转文本"中间层,实现"看、想、做"一体化,在信息搜索等场景中 Token 消耗较纯文本智能体降低约 60%,并以毫秒级响应适配高频互动生产环境。
人工智能领域的竞争正从"大参数"向"轻量化与高效率"快速演进。商汤科技此次推出的 SenseNova 6.7 Flash-Lite,专为"真实世界工作流"设计,试图打破传统智能体在处理复杂长链路任务时的瓶颈。

模型地址:日日新SenseNova官网
原生多模态架构:从"拼接"到"一体"
传统智能体模型多采用"语言+视觉"拼接设计,视觉信息仅作为文本补充,需经过"视觉转文本"中间环节处理。这种设计导致信息在"转译"过程中受损,且伴随着高昂的 Token 消耗。
SenseNova 6.7 Flash-Lite 改变了这一链路。它采用原生多模态架构,能够像人类一样直接"看懂"复杂的网页布局、文档结构与财务图表,无需中间转换环节。这种"看、想、做"一体化的机制,让模型在数据分析、深度调研及 PPT 自动化生成等高难度办公场景中,表现出极高的成功率。
官方数据显示,在权威智能体基准测试中,该模型以更小的参数量取得同级别多项 SOTA(最佳性能表现)。
效率与成本:Token 消耗直降 60%
在实际生产应用中,效率与成本是企业关注的重难点。由于取消了视觉转文本中间层,SenseNova 6.7 Flash-Lite 在保持较小参数规模的同时,智能体能力达到同级别领先水平。
在信息搜索等高频互动场景下,其 Token 消耗量较纯文本智能体降低了约 60%,并能实现毫秒级的响应反馈,更符合生产环境需求。这意味着企业可以用更低的成本运行更多智能体任务,大幅提升投入产出比。

降低门槛:Token Plan 限时免费与 Skills 开源
为降低开发者准入门槛并繁荣生态,商汤同步启动了两项举措:
- SenseNova Token Plan 限时免费:参与活动的开发者在首月可获得每 5 小时刷新一次、共计 1500 次的无门槛调用额度,覆盖 SenseNova 6.7 Flash-Lite 及 SenseNova U1 Fast 等系列模型。
- SenseNova-Skills GitHub 开源:商汤将模型的核心办公技能封装为 Skills,在 GitHub 平台开源,助力开发者更便捷地构建高性能智能体应用。
商汤首席科学家此前表示,公司将以"成本取胜"策略参与 AI 竞争,模型效率同样出色。Flash-Lite 版本的推出,正是这一战略的具体落地,瞄准对推理成本敏感的企业应用场景。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










