Vidu上线AI一键生成MV功能,普通用户也能做专业级作品
国内视频大模型Vidu又有大动作,其开放平台新上线“一键生成MV”功能,让视频创作进入全新时代。以往制作MV,需要创作者花费大量时间拼接素材,现在有了Vidu,只需提供背景音乐、参考图像和简单文本指令,系统就能在几分钟内输出高质量MV,画质精美且叙事连贯。
这一功能靠的是一套深度协同的多智能体系统。用户发出指令后,导演智能体先解析音乐结构和歌词,规划叙事脉络;分镜脚本智能体把创意转化为详细镜头描述;视觉生成阶段,“多图参考生视频”技术发挥作用,创作者最多上传7张参考图,系统就能在长视频中保持角色、场景和风格统一;最后,剪辑与合成智能体负责转场卡点和动态字幕生成。
这种“全自动制片”模式,大大降低了专业视频创作门槛。对创作者来说,Vidu不再只是一个工具,而是集成化的虚拟制片厂,让复杂的MV制作变得像发指令一样简单。
无论是专业创作者还是普通爱好者,都能借助Vidu轻松实现自己的MV创作梦想,为视频创作领域带来新的活力与可能。
工具地址:Vidu AI网页版官网

爱诗科技发布全球首个通用实时世界模型PixVerse R1,实时虚拟世界交互成可能
爱诗科技发布了全球首个通用实时世界模型PixVerse R1,还同步展示了其技术内核与应用场景,为虚拟世界带来全新交互体验,在游戏、影视、直播等领域开启“人人可共创”新时代。
PixVerse R1的强大源于三大核心技术。Omni原生多模态模型是“计算基座”,将多模态内容统一为连续Token流,可生成最高1080P画质且物理逻辑一致的数字世界。自回归流式生成机制赋予模型“持久记忆”,支持无限时长生成,解决长时序内容一致性问题。瞬时响应引擎IRE则像“神经反射”,通过创新技术压缩采样步骤,提升计算效率,实现即时响应。
在应用方面,该模型在多领域落地新范式。游戏领域,打造动态可交互虚拟环境;影视领域,实现互动式内容体验;直播领域,升级实时参与感与交互深度。它以“所想即所见,所说即所现”为核心,推动虚拟世界从回放式转向共创形态。
大家可以前往官网体验,感受实时世界的魅力,共同探索虚拟世界的无限可能。
工具地址:PixVerse电脑端官网

插画网站TEGAKI上线爆火:“AI禁入”成日本创作者新宠,首日因流量过大崩溃
2026年1月13日,禁止AI生成内容的插画网站TEGAKI正式上线,这个类似Pixiv的创意平台,因“AI禁入”特色受到日本创作者热烈追捧。上线首日注册用户就超5000人,远超预期的50人,直接导致服务器崩溃,目前网站已进入维护状态,重新开放时间未定。
TEGAKI由独立工程师兼艺术家Tochi开发,定位为人类创作艺术的“安全港湾”,无论传统还是数字艺术,都严禁AI生成或辅助创作的图像。为保证内容纯粹,平台有严格认证系统,创作者需提交延时视频和工作文件证明作品是手绘。
在防AI学习上,TEGAKI采取多重措施,禁止主流AI爬虫访问,设置元标签阻止学习,阻止可疑批量访问,还禁用右键和拖动功能防止图像下载。不过,Tochi强调并非否定AI技术,网站开发等环节也用了AI代码。
这一事件反映出AI生成内容对传统创作领域的冲击,以及创作者保护原创的诉求。
TEGAKI的火爆表明,在AI艺术泛滥的当下,纯人类创作内容仍有独特价值和市场需求,期待它早日重新开放,为创作者提供安全交流空间。

阿里通义千问上线两月:MAU破亿,AI超级应用C端战略显成效
据报道,阿里巴巴旗下AI应用千问上线仅两个月,月活跃用户数(MAU)就突破1亿,在学生和白领群体中增长势头强劲,不过阿里方面尚未官方回应这一数据。
千问App于2025年11月启动公测,这标志着阿里巴巴从B端企业服务向C端用户市场战略转型进入实质阶段。作为阿里进军AI to C市场的核心产品,千问被寄予打造“AI时代未来入口”的厚望。
阿里巴巴智能信息事业群总裁吴嘉将千问定位为“会聊天能办事的个人AI助手”,其核心竞争力在于智力水平和办事能力,目标是构建真正理解用户需求、能解决实际问题的AI助理。
若1亿MAU数据属实,这将是阿里在消费级AI应用市场的重要里程碑,也反映出国内用户对AI工具接受度快速提升。从公测到用户破亿,千问增长速度惊人,显示出超级AI应用在C端市场的巨大潜力。
未来,千问能否持续保持增长,为用户带来更多优质服务,值得我们期待。
模型地址:通义千问电脑端官网

智谱联合华为发布首个全流程国产化多模态大模型GLM-Image
智谱联合华为开源新一代图像生成模型GLM-Image,这一模型意义重大,它是首个在国产芯片算力底座上完成全流程的SOTA多模态模型,打破了算力垄断局面。
GLM-Image采用创新的“自回归 + 扩散解码器”混合架构,实现图像生成与语言模型深度融合。这一架构让模型处理“知识密集型”任务表现出色,能精准理解指令、刻画细节,解决海报排版、PPT制作等AI绘画难题。
该模型功能强大,支持文本到图像和图像到图像生成。文本转图像时,能根据描述生成高细节图像,在信息密集场景表现出色;图像到图像时,可进行图像编辑、风格迁移等多种任务,还能保留多主体一致性和人物物体身份。
在技术指标上,GLM-Image中文理解与渲染能力强,在复杂视觉文本生成榜单中位列开源模型第一,擅长汉字生成任务,还支持多种分辨率图像生成。
目前,它已在多平台开源,API调用价格低至每张图0.1元,未来还将推出优化版本,提升商用性价比,值得关注。

谷歌Veo3.1更新:支持竖屏视频,创作更便捷
谷歌本周二对视频生成模型Veo3.1进行关键升级,聚焦社交媒体生态整合与生成质量提升,为创作者带来更多便利。
此次更新最直观的是新增9:16竖屏格式原生生成能力。以往创作者要适配社交平台,需裁剪横向视频,现在可直接为YouTube Shorts、TikTok等生成符合比例的内容,谷歌还将其深度嵌入YouTube Shorts和YouTube Create应用。
在参考图像功能上,Veo3.1也有进化。动态增强方面,即便提示词短,系统也能通过参考图像生成更具表现力的角色表情与动态;高度一致性上,优化了角色、物体及背景连贯性,支持混合不同元素并保持视觉风格统一。
Veo3.1新特性面向不同用户开放。普通用户可通过Gemini应用体验,开发者与专业创作者可通过视频编辑器Flow等调用。针对专业端,还推出更强大的升频功能,最高支持1080p及4K分辨率输出,确保生成内容达专业放映标准。
此次更新让AI视频创作更贴合社交媒体需求,为创作者提供更多创作可能。
模型地址:谷歌Veo官网入口 (海外网站需要科学上网)

快手可灵AI商业化成绩亮眼,年化收入达2.4亿美元
快手科技披露了视频生成大模型产品可灵AI的商业化进展,数据十分亮眼。截至2025年12月,可灵AI单月营收突破2000万美元,年化收入运行率(ARR)达2.4亿美元。
可灵AI成长迅速,发布后第10个月就实现1亿美元ARR目标,仅用9个月就完成营收翻倍。这得益于产品高频迭代,12月初“Omni Launch Week”期间,发布一系列重磅模型,解决AI视频创作中角色一致性难题,简化音视频合成流程。
目前,可灵AI商业化版图覆盖多个专业创作领域,包括营销、电商、影视等。截至2025年底,已累计服务超6000万创作者,生成视频超6亿支,吸引超3万家企业用户合作。
快手表示将继续技术创新驱动产品升级,把技术优势转化为市场优势。
可灵AI凭借出色表现,在生成式AI市场占据一席之地,未来有望带来更多惊喜,为视频创作领域发展注入新动力。
工具地址:Kling AI(海外网站需要科学上网)

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










