爱诗科技发布PixVerse V6:AI视频在人物真实感与物理模拟上全面升级
3月31日,爱诗科技(AIsphere)正式发布视频生成大模型PixVerse V6。该版本在人物真实感、物理模拟及叙事连贯性上实现全面突破,是AI视频生成领域的一次重要迭代。
■ 人物质感:皮肤纹理与情绪表现
人物表现一直是AI视频的难点。PixVerse V6针对细节进行了深度优化:模型生成的皮肤具备真实的纹理结构、毛孔与细纹,光影反射更加自然,告别了以往AI视频常见的单一光滑表面;人物表情不再僵硬,能够随着镜头推进展现出层次分明的细腻情感,特写镜头表现力接近实拍质感。
■ 物理模拟:复杂运动中的稳定性
在高动态场景中,PixVerse V6展现了较强的物理属性模拟能力:无论是高速追逐还是多人打斗,角色间的运动关系保持高度稳定,大幅减少了穿模与干扰现象;模型深度理解了液体流动、布料摆动以及物体碰撞的物理逻辑,使动态画面呈现出符合直觉的自然律动。
■ 叙事升级:多镜头切换下的视觉统一
当镜头从远景切换至近景时,人物运动的惯性、光源方向与阴影关系均能保持统一;切镜前后逻辑自洽,使AI生成的视频具备了完整的视觉叙事能力。此外,创作者无需堆砌复杂参数,通过简短描述即可生成包含子弹时间、FPV、延时摄影等专业特效的镜头。该模型已同步上线拍我AI的Web端、App端及API平台。
工具地址:拍我AI官网

AI智能体产品选型指南:市面上20款"龙虾"产品如何选
2026年AI领域进入"全自动代理"阶段。由开源框架OpenClaw引发的智能体产品竞争已进入白热化阶段,市面上涌现出超过20款各具特色的智能体产品,月费跨度从19元到899元不等。这些AI智能体的核心突破在于不仅能对话,更能直接获取系统权限来执行任务。
■ 三大阵营各有侧重
目前市场由三大势力瓜分:以OpenClaw为首的开源阵营深受开发者青睐,拥有超过2.6万个功能插件;腾讯、字节等互联网大厂走"生态集成"路线,腾讯的QClaw实现了微信直连,字节的ArkClaw则与飞书深度绑定,主打企业级高并发稳定性;华为与小米相继推出系统级智能体,华为小艺Claw利用鸿蒙系统底层安全加固主打多端协同,小米则通过MiMo大模型联控米家设备,将AI代理触角伸向智能家居领域。
■ 选型避坑:隐私红线与Token陷阱
在享受自动化便利的同时,安全与成本风险不容忽视。工信部已对部分开源版本发出预警,提醒用户本地部署的AI代理可能存在远程代码执行风险,建议重要任务务必由人工复核,涉及财务或高隐私操作时优先选择具备硬件级隔离的产品。此外,不同产品计费模式差异巨大,用户需警惕"Token炸弹",建议提前设置消费上限,以防账单超出预期。
详细指南:https://clawpk.net/

中兴通讯联合字节跳动研发新一代豆包AI手机,预计2026年Q2发布
近日,中兴通讯在2025年度业绩说明会上宣布,正与字节跳动及相关生态伙伴推进新一代豆包AI手机的研发与认证工作,预计该产品将于2026年第二季度中晚期正式发布。此次合作旨在通过系统级深度集成大模型能力,实现从传统"人操作手机"向"AI代为操作"的交互模式演进。
■ 系统级深度集成,非简单插件堆叠
中兴旗下努比亚此前推出的集成豆包AI助手技术预览版,凭借系统级权限实现了跨应用自然语言执行能力。中兴通讯副总裁柏钢将其定义为手机交互的"自动驾驶",该模式通过大模型深度融入操作系统底层,而非简单的插件堆叠。
■ 同步布局自研智能体平台
除豆包系列外,中兴亦同步布局自研智能体平台"Co-Claw",并计划年内推出相关机型。当前全球AI手机赛道已进入爆发期,IDC预测2026年中国新一代AI手机出货量将达1.47亿台,市场占比首次突破50%。在全球端侧大模型部署量激增的背景下,中兴与字节的生态协同模式,展示了硬件厂商与大模型厂商深度整合的新路径。

美图AI开放平台发布Meitu CLI:8大影像能力接入OpenClaw生态
3月31日,美图AI开放平台正式发布Meitu CLI工具,标志着其核心影像能力实现标准化封装。首批美图AI Skills已同步登陆ClawHub并全面接入OpenClaw生态,开放包括AI图像、视频、设计在内的8种场景化影像能力。
■ 开箱即用,按量付费
此次发布的核心在于通过"开箱即用、按量付费"的轻量化模式,打破了高阶视觉生产的技术门槛,使"一人公司"与初创团队能够以极低成本构建专业级视觉内容生产工作流。
■ 支持移动端远程指令与自动化流程
技术层面,Meitu CLI将美图长年积累的影像算法解构为一系列可调用、可组合、可复用的标准化模块,极大提升了跨模态能力的调用效率。结合OpenClaw的云端集成特性,该工具支持移动端远程指令触发与事件驱动的自动化流程。例如在电商场景下,ERP系统上新可自动触发Meitu CLI生成并同步商品图,实现从创作到分发的全链路去人工化。
■ 抢占微型企业与个体开发者市场
美图此举反映了AI工具从"单一功能"向"工程化集成"转化的趋势。通过降低专业影像技术的工程化难度,美图正在通过能力拆解与生态接入,抢占微型企业及个体开发者的生产力底座市场。

OpenAI官方插件codex-plugin-cc发布:可在Claude Code中直接调用Codex能力
近期,AI开发者社区迎来重要更新,OpenAI在GitHub上正式发布了名为codex-plugin-cc的开源项目。这款插件允许开发者在Anthropic推出的命令行开发工具Claude Code中,直接调用OpenAI的Codex模型能力。
■ 打破大模型工具生态壁垒
这种"跨厂牌"的集成打破了以往大模型工具之间的生态壁垒,让开发者无需切换环境即可同时调用两家公司的技术优势。通过简单的指令配置,Claude Code可同时调用两家模型的能力。
■ 三大核心功能
插件提供三项核心功能:通过/codex:review指令发起标准只读代码审查,获取来自Codex的专业改进建议,这种双重校验机制能有效捕捉单一模型可能遗漏的逻辑漏洞;通过/codex:adversarial-review发起"对抗性审查",主动要求Codex挑战现有设计决策,通过"找茬"视角挖掘潜在的性能瓶颈或安全隐患;通过/codex:rescue将复杂的调试或修复任务转交给Codex子代理处理,实现任务的自动分流。
该项目已在GitHub开源,开发者可直接访问:github.com/openai/codex-plugin-cc获取。

通义实验室发布Qwen3.5-Omni:全模态架构斩获215项SOTA
通义实验室正式发布全新多模态大模型Qwen3.5-Omni。相比前代,该模型在理解力、交互感与任务执行力上实现了较大幅度的提升,能够无缝处理文本、图像、音频及视频输入。
■ 215项SOTA,全面超越Gemini-3.1Pro
在涵盖音视频分析、推理、对话及翻译的测试中,Qwen3.5-Omni斩获215项SOTA战绩。特别是在通用音频理解与识别领域,其表现已全面超越Gemini-3.1Pro,视觉与文本能力则保持了与同尺寸Qwen3.5模型持平的水准。
■ Hybrid-Attention MoE架构
模型延续了Thinker-Talker分工模式并进行底层重构:Thinker升级为Hybrid-Attention MoE,支持256K超长上下文,能处理长达10小时的音频或1小时的视频;Talker引入全新的ARIA技术与RVQ编码,解决了语音输出中常见的漏字、数字误读问题,并赋予模型强大的实时语音控制能力。
■ 多个实用场景落地
模型支持根据视频画面逻辑直接生成Python代码或前端原型;支持语义打断,能分辨咳嗽等杂音与真正插话的区别;可生成带时间戳的结构化Caption,精准识别视频中的人物动作、背景音乐变化及镜头切换;用户仅需上传一段录音即可定制支持113种语言的个性化音色。目前已在阿里云百炼平台上线,提供Plus、Flash、Light三种尺寸。
工具地址:通义千问官网

老板电器在AWE2026发布AI烹饪眼镜:搭载"食神"大模型支持全厨电联动
在AWE2026中国家电及消费电子博览会上,老板电器推出了全球首款AI烹饪眼镜。这款产品搭载自研"食神"烹饪大模型,通过AR技术与大模型结合,试图解决"做饭难"的痛点。
■ 实时烹饪指导与全厨电联动
佩戴眼镜后,AR技术会在用户视线中实时叠加烹饪步骤指导,即便新手也能精准掌控火候与调味。眼镜可作为"指挥中心",联动控制厨房内的烟机、灶具、蒸烤炸一体机等多种设备,实现烹饪全流程的智能闭环。
■ 个性化菜谱与AI面诊功能
眼镜具备个性化菜谱生成功能,能根据现有食材即时规划烹饪方案;同时创新性地加入了"AI面诊"功能,通过视觉识别提供定制化的膳食计划,将厨房与个人健康管理深度绑定。
■ 依托线下渠道推广
面对跨界产品的商业化难题,老板电器计划依托其深厚的线下渠道网络,让消费者在真实厨房场景中体验这款产品,从而降低XR设备在家庭场景的普及门槛。在传统厨电业务增长乏力的背景下,这一举措被视为老板电器在AI领域寻找新增长点的尝试。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










