每日AI资讯-2026年1月14日-AITOP100,AI资讯

Vidu上线AI一键生成MV功能，普通用户也能做专业级作品

国内视频大模型Vidu又有大动作，其开放平台新上线“一键生成MV”功能，让视频创作进入全新时代。以往制作MV，需要创作者花费大量时间拼接素材，现在有了Vidu，只需提供背景音乐、参考图像和简单文本指令，系统就能在几分钟内输出高质量MV，画质精美且叙事连贯。

这一功能靠的是一套深度协同的多智能体系统。用户发出指令后，导演智能体先解析音乐结构和歌词，规划叙事脉络；分镜脚本智能体把创意转化为详细镜头描述；视觉生成阶段，“多图参考生视频”技术发挥作用，创作者最多上传7张参考图，系统就能在长视频中保持角色、场景和风格统一；最后，剪辑与合成智能体负责转场卡点和动态字幕生成。

这种“全自动制片”模式，大大降低了专业视频创作门槛。对创作者来说，Vidu不再只是一个工具，而是集成化的虚拟制片厂，让复杂的MV制作变得像发指令一样简单。

无论是专业创作者还是普通爱好者，都能借助Vidu轻松实现自己的MV创作梦想，为视频创作领域带来新的活力与可能。

工具地址：Vidu AI网页版官网

Vidu上线AI一键生成MV功能

爱诗科技发布全球首个通用实时世界模型PixVerse R1，实时虚拟世界交互成可能

爱诗科技发布了全球首个通用实时世界模型PixVerse R1，还同步展示了其技术内核与应用场景，为虚拟世界带来全新交互体验，在游戏、影视、直播等领域开启“人人可共创”新时代。

PixVerse R1的强大源于三大核心技术。Omni原生多模态模型是“计算基座”，将多模态内容统一为连续Token流，可生成最高1080P画质且物理逻辑一致的数字世界。自回归流式生成机制赋予模型“持久记忆”，支持无限时长生成，解决长时序内容一致性问题。瞬时响应引擎IRE则像“神经反射”，通过创新技术压缩采样步骤，提升计算效率，实现即时响应。

在应用方面，该模型在多领域落地新范式。游戏领域，打造动态可交互虚拟环境；影视领域，实现互动式内容体验；直播领域，升级实时参与感与交互深度。它以“所想即所见，所说即所现”为核心，推动虚拟世界从回放式转向共创形态。

大家可以前往官网体验，感受实时世界的魅力，共同探索虚拟世界的无限可能。

工具地址：PixVerse电脑端官网

PixVerse R1

插画网站TEGAKI上线爆火：“AI禁入”成日本创作者新宠，首日因流量过大崩溃

2026年1月13日，禁止AI生成内容的插画网站TEGAKI正式上线，这个类似Pixiv的创意平台，因“AI禁入”特色受到日本创作者热烈追捧。上线首日注册用户就超5000人，远超预期的50人，直接导致服务器崩溃，目前网站已进入维护状态，重新开放时间未定。

TEGAKI由独立工程师兼艺术家Tochi开发，定位为人类创作艺术的“安全港湾”，无论传统还是数字艺术，都严禁AI生成或辅助创作的图像。为保证内容纯粹，平台有严格认证系统，创作者需提交延时视频和工作文件证明作品是手绘。

在防AI学习上，TEGAKI采取多重措施，禁止主流AI爬虫访问，设置元标签阻止学习，阻止可疑批量访问，还禁用右键和拖动功能防止图像下载。不过，Tochi强调并非否定AI技术，网站开发等环节也用了AI代码。

这一事件反映出AI生成内容对传统创作领域的冲击，以及创作者保护原创的诉求。

TEGAKI的火爆表明，在AI艺术泛滥的当下，纯人类创作内容仍有独特价值和市场需求，期待它早日重新开放，为创作者提供安全交流空间。

TEGAKI上线

阿里通义千问上线两月：MAU破亿，AI超级应用C端战略显成效

据报道，阿里巴巴旗下AI应用千问上线仅两个月，月活跃用户数（MAU）就突破1亿，在学生和白领群体中增长势头强劲，不过阿里方面尚未官方回应这一数据。

千问App于2025年11月启动公测，这标志着阿里巴巴从B端企业服务向C端用户市场战略转型进入实质阶段。作为阿里进军AI to C市场的核心产品，千问被寄予打造“AI时代未来入口”的厚望。

阿里巴巴智能信息事业群总裁吴嘉将千问定位为“会聊天能办事的个人AI助手”，其核心竞争力在于智力水平和办事能力，目标是构建真正理解用户需求、能解决实际问题的AI助理。

若1亿MAU数据属实，这将是阿里在消费级AI应用市场的重要里程碑，也反映出国内用户对AI工具接受度快速提升。从公测到用户破亿，千问增长速度惊人，显示出超级AI应用在C端市场的巨大潜力。

未来，千问能否持续保持增长，为用户带来更多优质服务，值得我们期待。

模型地址：通义千问电脑端官网

阿里千问

智谱联合华为发布首个全流程国产化多模态大模型GLM-Image

智谱联合华为开源新一代图像生成模型GLM-Image，这一模型意义重大，它是首个在国产芯片算力底座上完成全流程的SOTA多模态模型，打破了算力垄断局面。

GLM-Image采用创新的“自回归 + 扩散解码器”混合架构，实现图像生成与语言模型深度融合。这一架构让模型处理“知识密集型”任务表现出色，能精准理解指令、刻画细节，解决海报排版、PPT制作等AI绘画难题。

该模型功能强大，支持文本到图像和图像到图像生成。文本转图像时，能根据描述生成高细节图像，在信息密集场景表现出色；图像到图像时，可进行图像编辑、风格迁移等多种任务，还能保留多主体一致性和人物物体身份。

在技术指标上，GLM-Image中文理解与渲染能力强，在复杂视觉文本生成榜单中位列开源模型第一，擅长汉字生成任务，还支持多种分辨率图像生成。

目前，它已在多平台开源，API调用价格低至每张图0.1元，未来还将推出优化版本，提升商用性价比，值得关注。

GLM-Image

谷歌Veo3.1更新：支持竖屏视频，创作更便捷

谷歌本周二对视频生成模型Veo3.1进行关键升级，聚焦社交媒体生态整合与生成质量提升，为创作者带来更多便利。

此次更新最直观的是新增9:16竖屏格式原生生成能力。以往创作者要适配社交平台，需裁剪横向视频，现在可直接为YouTube Shorts、TikTok等生成符合比例的内容，谷歌还将其深度嵌入YouTube Shorts和YouTube Create应用。

在参考图像功能上，Veo3.1也有进化。动态增强方面，即便提示词短，系统也能通过参考图像生成更具表现力的角色表情与动态；高度一致性上，优化了角色、物体及背景连贯性，支持混合不同元素并保持视觉风格统一。

Veo3.1新特性面向不同用户开放。普通用户可通过Gemini应用体验，开发者与专业创作者可通过视频编辑器Flow等调用。针对专业端，还推出更强大的升频功能，最高支持1080p及4K分辨率输出，确保生成内容达专业放映标准。

此次更新让AI视频创作更贴合社交媒体需求，为创作者提供更多创作可能。

模型地址：谷歌Veo官网入口（海外网站需要科学上网）

谷歌Veo3.1

快手可灵AI商业化成绩亮眼，年化收入达2.4亿美元

快手科技披露了视频生成大模型产品可灵AI的商业化进展，数据十分亮眼。截至2025年12月，可灵AI单月营收突破2000万美元，年化收入运行率（ARR）达2.4亿美元。

可灵AI成长迅速，发布后第10个月就实现1亿美元ARR目标，仅用9个月就完成营收翻倍。这得益于产品高频迭代，12月初“Omni Launch Week”期间，发布一系列重磅模型，解决AI视频创作中角色一致性难题，简化音视频合成流程。

目前，可灵AI商业化版图覆盖多个专业创作领域，包括营销、电商、影视等。截至2025年底，已累计服务超6000万创作者，生成视频超6亿支，吸引超3万家企业用户合作。

快手表示将继续技术创新驱动产品升级，把技术优势转化为市场优势。

可灵AI凭借出色表现，在生成式AI市场占据一席之地，未来有望带来更多惊喜，为视频创作领域发展注入新动力。

工具地址：Kling AI（海外网站需要科学上网）

快手可灵AI

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

aitop100官方交流30群 AIGC大赛社群