字节跳动发布全双工语音大模型Seeduplex:误回复率与误打断率降低50%
4月9日,字节跳动Seed团队正式发布原生全双工语音大模型Seeduplex,标志着AI语音交互从传统的"回合制"向更贴近人类直觉的"实时自然交互"演进。作为豆包端到端语音模型的重大升级,Seeduplex核心突破在于实现了"边听边说"的同步处理框架,目前该技术已在豆包App全量上线。
■ 抗干扰能力大幅提升
Seeduplex通过语音与语义的联合建模,显著提升了模型在复杂声学环境下的抗干扰能力。相比半双工方案,其误回复率与误打断率降低了50%,即便在导航干扰、多人混叠或环境杂音中,也能精准识别主用户意图并联动环境信息。
■ 动态判停技术优化对话节奏
在对话节奏控制上,该模型引入动态判停技术,将判停延迟缩短约250ms,抢话比例下降40%,能敏锐区分用户的"思考留白"与"对话结束"。工程层面,团队通过投机采样与量化优化,在确保超低时延的同时解决了高并发下的卡顿挑战,使通话满意度绝对值提升8.34%。
■ 后续引入视觉模态
Seeduplex的落地不仅是交互效率的飞跃,更预示着感知、思考与执行一体化的未来趋势。随着后续视觉模态的引入,语音助手将向"听、看、想、说"多维协同的通用智能体深度进化,重塑智能硬件及多模态交互的行业标准。
项目地址: https://seed.bytedance.com/seeduplex

智元发布GO-2具身大模型:首创动作思维链,LIBERO基准成功率达98.5%
智元机器人正式发布了新一代具身基座大模型Genie Operator-2(简称GO-2)。该模型的核心使命是彻底打通从"逻辑推理"到"精准动作执行"的最后一公里,让机器人不仅能听懂指令,更能稳定地完成任务。
■ 首创动作思维链
GO-2引入了一种全新的交互逻辑,彻底改变了机器人的思考方式:不同于传统模型直接输出控制信号,GO-2会先在脑海中生成一段高层动作序列,作为任务的整体规划;通过这种结构化的中间表示,机器人实现了从"感知输入"到"动作空间推理"的跨越。相关技术成果已被AI顶级会议CVPR2026接收。
■ 异步双系统确保执行稳定
为了解决机器人执行过程中的稳定性问题,智元构建了一套精密协同的异步体系:慢系统以低频运行,持续输出具备长程逻辑的动作规划"意图流";快系统以高频运行,实时对齐慢系统的规划,当遇到桌面高度偏差或物体滑动时,快系统会进行瞬时修正,确保最终动作贴合预设轨迹。
■ 多个基准测试刷新SOTA
在多项权威测试中,GO-2展现出了统治级的表现:LIBERO Benchmark平均成功率高达98.5%,在四类核心任务中均排名全球第一;Genie Sim3.0在仅使用仿真数据训练的情况下,真实环境测试成功率达82.9%,显著优于竞对模型(如π0.5)。

腾讯云QClaw V2发布:支持最多3个Agent并行工作与跨应用直连
腾讯云近日宣布其AI助手QClaw正式上线V2大版本。此次升级的核心在于打破了AI单兵作战的局限,通过引入多Agent协同和跨应用直连技术,为用户构建起一个高效、安全的"数字工作团队",大幅提升了复杂任务的处理能力。
■ 多专家并行与应用直连
新版本支持同时调用最多3个Agent并行工作,用户可自定义其性格与专业背景,或直接选用系统内置的撰稿人、程序员等角色。这种模式将长任务拆解,有效解决了AI在处理复杂逻辑时容易出现的"记忆遗忘"与"已读乱回"问题。同时,QClaw V2引入了连接器功能,AI生成的内容可以直接在腾讯文档、Notion或邮箱等主流工具中自动创建或发送,实现了从指令到执行的"最后一公里"直连。
■ 首发安全管家护航数据
针对用户担心的隐私与数据安全风险,QClaw V2业内首发了"龙虾管家"防护系统。该功能通过实时监控条,将AI的操作严格限制在安全范围内,有效拦截高风险执行脚本和文件误删,确保核心数据不受侵扰。
目前,QClaw V2已深度接入腾讯会议、金山文档及金山问卷等多项高频办公场景。
工具地址:腾讯云QClaw官网

即梦AI发布协作型叙事工具"小章鱼"Octo:首推VibeCreate创作模式
即梦AI于4月8日正式上线首个协作型AI叙事创作工具"小章鱼"Octo,并创新性地提出VibeCreate(氛围创作)模式,试图重塑AI内容生成的交互范式。这一动作标志着AI创作从传统的"单向指令、结果交付"模式,向"同屏共创、深度协同"的合伙人模式演进。目前Octo仅在Web端开放内测申请,尚未全量上线。
■ 对话+多模态混合的同屏共创
在核心技术层面,Octo支持"对话+多模态混合"的同屏共创,其搭载的智能Agent能实时感知界面内容与用户操作,通过图片、音频等多种形式与创作者进行异步并行的创意碰撞。该工具构建了从故事大纲梳理、核心资产构建到剧本分镜生成、短片成片输出的全流程制作闭环,并深度联动Seedance2.0、Seedream5.0Lite等即梦最新底层模型。
■ AI定位为创意合伙人
继VibeCoding重构人与代码的关系后,即梦提出的VibeCreate模式进一步拓展了AI在创意产业的边界。通过将AI定位为"创意合伙人",Octo不仅提高了生成效率,更确保了灵感在创作全链路中的承接与放大。这种协作型工具的出现,预示着AI视频创作正从单一的模型能力竞争转向工作流集成与交互体验的深度革新。
工具地址:即梦AI官网

MiniMax发布MMX-CLI:一行代码原生接入全模态模型无需MCP Server
MiniMax正式发布了专为AI Agent打造的命令行工具MMX-CLI。这款工具的问世,意味着Agent在复杂编程与创作环境中的"生存能力"迎来了质的飞跃。
■ 零适配门槛,全模态覆盖
MMX-CLI的核心价值在于极大地简化了Agent与大模型之间的交互逻辑:接入后,Agent可以在Claude Code、OpenClaw等主流开发环境中,实现对MiniMax最新全模态模型的原生调用;无论是复杂的代码编写、视频生成、语音合成,还是音乐创作,Agent均可通过命令行直接驱动,无需再为每个功能适配繁琐的API接口;开发者不再需要额外编写复杂的MCP Server,大幅降低了Agent系统的维护难度与响应延迟。
■ 淘宝闪购AI店铺助手上线语音搜索
就在MiniMax赋能开发者的同时,AI Agent在商业场景的落地也在提速:淘宝闪购面向餐饮商家的AI店铺助手正式全量上线语音搜索功能,这是行业内首个能通过语音指令直接调起执行窗口并完成闭环的商家Agent服务。
商家只需通过语音说出"帮我查下昨天的异常订单"或"屏蔽那个恶意差评用户",AI即可直接执行操作,无需手动点选。
工具地址:MiniMax官网

Anthropic上线Claude Managed Agents公测版:从原型到发布可在几天内完成
Anthropic今日正式宣布,Claude Managed Agents公开测试版已在Claude平台上线。Claude Managed Agents是专为构建和大规模部署AI代理而设计的一站式解决方案,将性能优化的代理框架与生产级基础设施完美结合,帮助开发者大幅缩短开发周期。
■ 三大核心亮点
Claude Managed Agents核心亮点包括:一体化集成,无需自行搭建复杂基础设施,即可快速构建高性能AI代理;高效开发流程,从原型设计到正式发布,整个过程可在几天内完成;生产就绪,内置经过优化的代理框架,支持大规模部署需求。
■ 解决从实验到生产的痛点
Anthropic表示,这一新功能旨在解决开发者在将AI代理从实验阶段转向实际生产环境时面临的痛点,让企业与开发者能够更轻松地实现AI代理的商业化落地。Claude Managed Agents现已开启公开测试,感兴趣的用户可立即登录Claude平台进行体验。
详情查看: https://www.aitop100.cn/infomation/details/33595.html

Meta发布个人超级智能模型Muse Spark:算力仅需Llama4Maverick的十分之一
北京时间4月9日,Meta正式推出个人超级智能模型Muse Spark,标志着其全新Muse系列模型首款产品落地。该模型原生支持多模态、深度推理、工具调用、视觉思维链及多Agent协同,主打"个人超级智能"定位,已在Meta.ai官网和Meta AI应用中上线。
■ 计算效率提升10倍
相比Meta自家的Llama4Maverick,Muse Spark在达到同等性能水平时,所需计算量减少了10倍以上。Contemplating模式采用多智能体并行推理架构,在Humanity’s Last Exam基准上取得58%的成绩,在FrontierScience Research基准上达到38%,直接对标Gemini3.1Deep Think和GPT5.4Pro。
■ 原生多模态架构与视觉能力
Muse Spark采用从底层设计就整合视觉信息的原生多模态架构,而非后期拼接。这一设计使其在视觉STEM问题、实体识别与定位任务中表现突出。最直观的演示是,用户只需拍一张照片,模型即可自动生成完整的数独游戏,展现出强大的视觉理解与生成能力。
■ 与1000多名医生联合训练
在健康领域,Muse Spark与超过1000名医生合作完成专项训练,能够生成高度互动的健康信息展示。针对用户上传的饮食照片或数据,模型可进行营养成分分析,并以红绿点直观标注推荐与不推荐食物,帮助用户快速做出科学决策。
目前已在Meta.ai和Meta AI移动应用中正式上线,同时面向部分用户开放私有API预览。
工具地址: https://meta.ai

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










