每日AI资讯-2026年3月31日-AITOP100,AI资讯

爱诗科技发布PixVerse V6：AI视频在人物真实感与物理模拟上全面升级

3月31日，爱诗科技（AIsphere）正式发布视频生成大模型PixVerse V6。该版本在人物真实感、物理模拟及叙事连贯性上实现全面突破，是AI视频生成领域的一次重要迭代。

■ 人物质感：皮肤纹理与情绪表现

人物表现一直是AI视频的难点。PixVerse V6针对细节进行了深度优化：模型生成的皮肤具备真实的纹理结构、毛孔与细纹，光影反射更加自然，告别了以往AI视频常见的单一光滑表面；人物表情不再僵硬，能够随着镜头推进展现出层次分明的细腻情感，特写镜头表现力接近实拍质感。

■ 物理模拟：复杂运动中的稳定性

在高动态场景中，PixVerse V6展现了较强的物理属性模拟能力：无论是高速追逐还是多人打斗，角色间的运动关系保持高度稳定，大幅减少了穿模与干扰现象；模型深度理解了液体流动、布料摆动以及物体碰撞的物理逻辑，使动态画面呈现出符合直觉的自然律动。

■ 叙事升级：多镜头切换下的视觉统一

当镜头从远景切换至近景时，人物运动的惯性、光源方向与阴影关系均能保持统一；切镜前后逻辑自洽，使AI生成的视频具备了完整的视觉叙事能力。此外，创作者无需堆砌复杂参数，通过简短描述即可生成包含子弹时间、FPV、延时摄影等专业特效的镜头。该模型已同步上线拍我AI的Web端、App端及API平台。

工具地址：拍我AI官网

爱诗科技发布PixVerse V6

AI智能体产品选型指南：市面上20款"龙虾"产品如何选

2026年AI领域进入"全自动代理"阶段。由开源框架OpenClaw引发的智能体产品竞争已进入白热化阶段，市面上涌现出超过20款各具特色的智能体产品，月费跨度从19元到899元不等。这些AI智能体的核心突破在于不仅能对话，更能直接获取系统权限来执行任务。

■ 三大阵营各有侧重

目前市场由三大势力瓜分：以OpenClaw为首的开源阵营深受开发者青睐，拥有超过2.6万个功能插件；腾讯、字节等互联网大厂走"生态集成"路线，腾讯的QClaw实现了微信直连，字节的ArkClaw则与飞书深度绑定，主打企业级高并发稳定性；华为与小米相继推出系统级智能体，华为小艺Claw利用鸿蒙系统底层安全加固主打多端协同，小米则通过MiMo大模型联控米家设备，将AI代理触角伸向智能家居领域。

■ 选型避坑：隐私红线与Token陷阱

在享受自动化便利的同时，安全与成本风险不容忽视。工信部已对部分开源版本发出预警，提醒用户本地部署的AI代理可能存在远程代码执行风险，建议重要任务务必由人工复核，涉及财务或高隐私操作时优先选择具备硬件级隔离的产品。此外，不同产品计费模式差异巨大，用户需警惕"Token炸弹"，建议提前设置消费上限，以防账单超出预期。

详细指南：https://clawpk.net/

OpenClaw

中兴通讯联合字节跳动研发新一代豆包AI手机，预计2026年Q2发布

近日，中兴通讯在2025年度业绩说明会上宣布，正与字节跳动及相关生态伙伴推进新一代豆包AI手机的研发与认证工作，预计该产品将于2026年第二季度中晚期正式发布。此次合作旨在通过系统级深度集成大模型能力，实现从传统"人操作手机"向"AI代为操作"的交互模式演进。

■ 系统级深度集成，非简单插件堆叠

中兴旗下努比亚此前推出的集成豆包AI助手技术预览版，凭借系统级权限实现了跨应用自然语言执行能力。中兴通讯副总裁柏钢将其定义为手机交互的"自动驾驶"，该模式通过大模型深度融入操作系统底层，而非简单的插件堆叠。

■ 同步布局自研智能体平台

除豆包系列外，中兴亦同步布局自研智能体平台"Co-Claw"，并计划年内推出相关机型。当前全球AI手机赛道已进入爆发期，IDC预测2026年中国新一代AI手机出货量将达1.47亿台，市场占比首次突破50%。在全球端侧大模型部署量激增的背景下，中兴与字节的生态协同模式，展示了硬件厂商与大模型厂商深度整合的新路径。

豆包AI手机

美图AI开放平台发布Meitu CLI：8大影像能力接入OpenClaw生态

3月31日，美图AI开放平台正式发布Meitu CLI工具，标志着其核心影像能力实现标准化封装。首批美图AI Skills已同步登陆ClawHub并全面接入OpenClaw生态，开放包括AI图像、视频、设计在内的8种场景化影像能力。

■ 开箱即用，按量付费

此次发布的核心在于通过"开箱即用、按量付费"的轻量化模式，打破了高阶视觉生产的技术门槛，使"一人公司"与初创团队能够以极低成本构建专业级视觉内容生产工作流。

■ 支持移动端远程指令与自动化流程

技术层面，Meitu CLI将美图长年积累的影像算法解构为一系列可调用、可组合、可复用的标准化模块，极大提升了跨模态能力的调用效率。结合OpenClaw的云端集成特性，该工具支持移动端远程指令触发与事件驱动的自动化流程。例如在电商场景下，ERP系统上新可自动触发Meitu CLI生成并同步商品图，实现从创作到分发的全链路去人工化。

■ 抢占微型企业与个体开发者市场

美图此举反映了AI工具从"单一功能"向"工程化集成"转化的趋势。通过降低专业影像技术的工程化难度，美图正在通过能力拆解与生态接入，抢占微型企业及个体开发者的生产力底座市场。

Meitu CLI

OpenAI官方插件codex-plugin-cc发布：可在Claude Code中直接调用Codex能力

近期，AI开发者社区迎来重要更新，OpenAI在GitHub上正式发布了名为codex-plugin-cc的开源项目。这款插件允许开发者在Anthropic推出的命令行开发工具Claude Code中，直接调用OpenAI的Codex模型能力。

■ 打破大模型工具生态壁垒

这种"跨厂牌"的集成打破了以往大模型工具之间的生态壁垒，让开发者无需切换环境即可同时调用两家公司的技术优势。通过简单的指令配置，Claude Code可同时调用两家模型的能力。

■ 三大核心功能

插件提供三项核心功能：通过/codex:review指令发起标准只读代码审查，获取来自Codex的专业改进建议，这种双重校验机制能有效捕捉单一模型可能遗漏的逻辑漏洞；通过/codex:adversarial-review发起"对抗性审查"，主动要求Codex挑战现有设计决策，通过"找茬"视角挖掘潜在的性能瓶颈或安全隐患；通过/codex:rescue将复杂的调试或修复任务转交给Codex子代理处理，实现任务的自动分流。

该项目已在GitHub开源，开发者可直接访问：github.com/openai/codex-plugin-cc获取。

OpenAI官方插件codex-plugin-cc发布

通义实验室发布Qwen3.5-Omni：全模态架构斩获215项SOTA

通义实验室正式发布全新多模态大模型Qwen3.5-Omni。相比前代，该模型在理解力、交互感与任务执行力上实现了较大幅度的提升，能够无缝处理文本、图像、音频及视频输入。

■ 215项SOTA，全面超越Gemini-3.1Pro

在涵盖音视频分析、推理、对话及翻译的测试中，Qwen3.5-Omni斩获215项SOTA战绩。特别是在通用音频理解与识别领域，其表现已全面超越Gemini-3.1Pro，视觉与文本能力则保持了与同尺寸Qwen3.5模型持平的水准。

■ Hybrid-Attention MoE架构

模型延续了Thinker-Talker分工模式并进行底层重构：Thinker升级为Hybrid-Attention MoE，支持256K超长上下文，能处理长达10小时的音频或1小时的视频；Talker引入全新的ARIA技术与RVQ编码，解决了语音输出中常见的漏字、数字误读问题，并赋予模型强大的实时语音控制能力。

■ 多个实用场景落地

模型支持根据视频画面逻辑直接生成Python代码或前端原型；支持语义打断，能分辨咳嗽等杂音与真正插话的区别；可生成带时间戳的结构化Caption，精准识别视频中的人物动作、背景音乐变化及镜头切换；用户仅需上传一段录音即可定制支持113种语言的个性化音色。目前已在阿里云百炼平台上线，提供Plus、Flash、Light三种尺寸。

工具地址：通义千问官网

通义实验室发布Qwen3.5-Omni