每日AI资讯-2026年4月30日-AITOP100,AI资讯

快手推出KroWork：AI桌面智能体把重复工作变成本地应用，沙箱运行保障数据不上云

快手正式发布AI桌面智能体KroWork，面向非技术用户，允许通过自然语言指令自主完成文件处理、浏览器自动化及应用生成等办公任务。其核心逻辑是把日常重复工作流程转化为本地桌面应用，用户只需告诉KroWork所需功能，它便自动规划步骤并生成结果，后续点击"运行"即可复用，无需再次付费或消耗token。

具体场景上，财务人员可指示"制作发票报销汇总工具"，KroWork便会生成一个本地应用，自动归类发票、校验金额并生成汇总报表。与其他AI产品的一次性服务不同，KroWork将工作流固化为可反复使用的本地应用资产，这是其核心差异化优势。

安全层面，所有操作均在沙箱环境中执行，用户数据不会上传至云端，每一步执行均可被监督和控制，保证了使用过程的透明性与安全性。

KroWork同时集成了多个国内外顶尖AI模型，使其能快速高效完成从写报告、做分析到其他日常办公任务的各类需求。快手此举瞄准的是"非技术用户也能创建桌面工具"这一空白市场，将AI能力从对话式交互延伸到工作流固化，值得关注其后续生态拓展。

快手推出KroWork

巨日禄接入火山引擎Seedance 2.0：AI短剧制作效率提升10倍，画面可用率从30%跃升至90%

杭州巨日禄科技宣布与火山引擎达成深度合作，正式接入豆包视频生成模型Seedance 2.0，标志着AI短剧制作从零散低效的"手工作坊"模式向工业化流程转变。

数据对比最为直观：精品AI剧的制作效率提升近10倍，原本15至30天的生产周期被压缩至1到3天。更关键的是画面可用率的质变——传统AI生成模式下画面合格率仅约30%，新技术架构下跃升至90%以上，极大降低了素材筛选的时间成本。这意味着创作者不再需要在大量废片中反复筛选，产出效率的实质性提升来自合格率的改善而非单纯的生成速度。

此次合作并非简单的工具接入，而是构建了覆盖前期创作到最终交付的全栈式技术架构。巨日禄AI通过整合火山引擎的算力与算法优势，确保了视频生成过程中的连贯性与表现力。

双方计划持续深化技术探索，推动国内AI影视产业向更成熟的工业化阶段迈进。在AI短剧赛道从野蛮生长转向精品化的当下，工业化生产能力的建设正在成为平台竞争的新焦点。

工具地址：巨日禄AI官网

巨日禄AI

红果短剧清理超万部低质AI剧：9天下架3522部，强化版权保护与价值观审核

红果短剧平台近日展开大规模内容治理行动，已处置超过万部低质AI剧，重点针对剧情导向、价值观表达和制作质量问题，尤其是内容低俗、画面粗糙、剧情逻辑混乱及渲染极端情绪的作品。

根据红果官方数据，仅4月7日至15日九天内，平台就下架了3522部不符合标准的低质剧集。红果短剧总编辑乐力表示，平台将通过加强审核体系，严格禁止低俗庸俗、炫富和传播负面价值观的内容，从源头杜绝低质量短剧的出现。

除内容质量治理外，红果还加强了版权保护力度，严厉打击创意抄袭和肖像侵权等行为。4月6日官方公告重申，任何未经授权的素材使用和违规行为都将受到严厉打击。对情节严重且屡次违规的出品方，平台将采取下架、封禁、终止合作乃至法律追责等措施。这一系列治理动作与AI短剧行业整体从"量"向"质"转型的大趋势吻合——随着生成成本降低带来的内容泛滥问题日益突出，平台主动设置准入门槛已成为行业共识。

红果短剧清理超万部低质AI剧

CVPR2026揭示视觉智能范式转向：从追求准确率到"感知-推理-决策"一体化，多项选择评测虚高20分

CVPR2026上视觉智能研究重点发生深刻转向：视觉不再是终点，而是服务于推理、决策与交互的中介。当感知能力接近人类极限，单纯追求准确率的边际收益正在递减。

推理机制方面，VideoAuto-R1框架提出"按需推理"概念——简单感知任务直接作答，仅复杂逻辑场景触发推理，在保持最优性能的同时将平均输出长度缩减3.3倍。推理媒介也在变化，新趋势让模型在潜在空间内直接完成隐式视觉推理，无需转化为线性文本，更自然地刻画复杂视觉结构。

评测体系反思是另一大焦点。当前视觉语言模型评测多采用多项选择题，但研究发现模型常通过排除法或选项偏差"投机取巧"，真实得分可能被虚高约20个百分点。业界正推动"可验证开放问答"范式，迫使模型真正理解视觉内容。VS-Bench等新基准要求模型在合作、竞争等复杂交互中具备策略推理和决策能力。

基础设施层面，Molmo2等开源模型完整公开权重、数据和训练流程，Pico-Banana-400K等大规模真实数据集填补了过度依赖合成数据的空白。视觉智能正从单一感知演进为融合感知、认知与行动的一体化智能，这是推理机制、评测范式与数据供给的系统性重构。

CVPR2026揭示视觉智能范式转向

文心一言5.1预览版上线LMSYS竞技场：总榜第13位，百度大模型进入新一轮迭代周期

百度文心一言5.1预览版近日低调上线国际权威大模型盲测平台LMSYS Chatbot Arena，目前总榜位列第13位。此次悄然入场标志着百度核心模型已进入新一轮快速迭代周期，并开始接受全球用户的直接质量检验与基准对标。

百度官方尚未公开5.1预览版的具体参数规模及架构改进细节，但根据过往迭代逻辑与竞技场表现分析，该版本预计在语义理解、多轮对话逻辑及长文本处理稳定性上进行了针对性强化。进入LMSYS竞技场通常被视为模型具备高度成熟交互能力及全球化视野的信号，意味着国产大模型正加速通过公开的国际主流评价体系验证实战能力。

行业观察认为，文心一言5.1的低调发布与高位入榜，展现了百度在大模型赛道"小步快跑"的竞争策略。随着国产大模型在国际排行榜中排位集体前移，中国AI力量正从跟随式开发转向以智效比与真实交互体验为核心的质量突围。

文心一言5.1后续全量发布的表现值得持续关注，其能否在中文语义理解与生产力应用上树立新标杆，将是检验这一策略成效的关键。

工具地址：文心一言官网

文心一言

蚂蚁集团开源Ling-2.6-1T万亿级模型："快思考"机制降低Token开销，代码生成与缺陷修复达开源顶尖水平

蚂蚁集团旗下百灵大模型团队宣布正式开源万亿级旗舰模型Ling-2.6-1T。该模型不盲目追求参数规模堆叠，而是致力于在真实复杂任务中系统性优化指令执行、工具适配及长上下文承接能力。

架构创新方面，Ling-2.6-1T采用混合架构，通过抑制过程冗余的强化奖励策略降低Token开销，实现"快思考"机制——在保持万亿参数智能上限的同时，以更低成本直接输出高质量结果，大幅提升智效比。针对复杂工作流，该模型加强了对复合型任务的学习，在多项执行类权威基准评测中，代码生成、缺陷修复及噪声环境下精准推理均达到开源领域顶尖水平。

工程落地方面，Ling-2.6-1T实现了与主流Agent框架的高度兼容，能适配多工具、多约束的复杂业务场景，旨在成为企业系统中可部署、可持续运行的核心能力底座。

目前该模型已在Hugging Face和ModelScope上线，OpenRouter平台免费API调用服务延期一周，进一步降低万亿级模型使用门槛。蚂蚁此举将万亿级模型的竞争焦点从参数规模转向实际任务效能，"快思考"理念值得关注。

Hugging Face：https://huggingface.co/inclusionAI/Ling-2.6-1T
ModelScope：https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T

蚂蚁集团开源Ling-2.6-1T万亿级模型

Chrome正式发布Prompt API：网页直接调用Gemini Nano本地模型，浏览器原生AI时代来临

Google Chrome浏览器正式推出Prompt API，开发者可通过简单JavaScript代码在网页中直接调用内置Gemini Nano模型，实现本地AI能力。这一功能在Hacker News上引发热议，被视为浏览器AI能力民主化的重要一步。

Prompt API允许网页应用向浏览器内置的Gemini Nano轻量级模型发送自然语言指令。与传统方式相比，这一变化颠覆了网页集成AI的流程——过去开发者需要调用外部API，面临跨域限制、密钥管理、费用支出及数据隐私等问题。现在只需几行代码即可创建AI会话，模型通过WebAssembly或WebGPU在浏览器内运行，数据全程留在用户设备上，支持离线使用。

核心优势在于三个方面：本地运行确保隐私优先，用户输入不上传云端；降低开发门槛，无需服务器成本和API密钥管理；适用场景广泛，从浏览器扩展到普通网页均可利用。目前Prompt API仍处于实验阶段，主要在Chrome Canary、Dev频道或Chrome137+中通过启用实验标志体验，模型能力相对云端大模型有限，需设备具备足够内存和GPU加速。

微软Edge也在探索类似接口，行业正朝着设备端AI方向加速演进。当AI像JavaScript一样成为浏览器标准能力时，Web应用将迎来新一轮创新浪潮。

Chrome Prompt