每日AI资讯-2025年08月11日-AITOP100,AI资讯

创新虚拟试穿神器Voost：服装细节还原大师来袭

在时尚购物领域，虚拟试穿一直是个难题，不过最近研究人员带来了好消息，推出了创新框架Voost。以前，虚拟试衣合成的人像穿着服装图像，因姿态和外观变化，很难准确建模服装与身体的对应关系。

Voost可不一般，它是个统一且可扩展的模型，靠单一的扩散变换器（DiT）同时学习虚拟试衣和试脱任务。和传统方法不同，它能让服装和人双向监督，增强关系推理，还不依赖特定网络、辅助损失和额外标签，任务灵活又生成多样。

研究团队还引入两种推理技术提升鲁棒性。注意力温度缩放技术，在分辨率或遮罩变化时保持模型稳定；自我校正采样利用任务双向一致性优化结果，让模型适应不同输入。

大量实验表明，Voost表现优异，在对齐准确性、视觉逼真度和泛化能力等方面，都远超许多强基线模型。这一成果为虚拟试衣和试脱技术指明新方向，也为相关研究打基础。

Voost展示了深度学习在服装试穿体验上的潜力，预示着数字时尚和在线购物将迎来变革。以后网购，我们或许能更真实地感受服装上身效果，购物体验大大提升。相信随着技术发展，Voost会不断完善，给我们带来更多惊喜。

github地址： https://nxnai.github.io/Voost/ （海外网站需要科学上网）

Voost,虚拟试穿神器

阿里通义新动作：Wan2.2-I2V-Flash图生视频模型惊艳登场

在数字媒体和娱乐行业，视频生成技术备受关注。近日，阿里通义大模型宣布推出最新图生视频模型Wan2.2-12V-Flash，给用户带来全新体验。

Wan2.2-12V-Flash可不简单，它在保持电影级视觉呈现的同时，实现了生成速度与性价比的全面提升。和前代Wan2.1相比，推理速度提升了12倍，创作效率大幅提高。而且，它的指令遵循能力也大幅提升，能直接响应各种特效提示词，精准控制运镜，确保指令准确执行。

这个新模型还能稳定输出风格化图像，并添加合理自然的动态效果，不管输入什么风格化图像，都能保持独特风格。

在价格方面，Wan2.2-12V-Flash也很亲民，低至0.1元/秒，抽卡成功率相比Wan2.1提升了123%，性价比超高。

现在，阿里云百炼平台已开放该模型的API调用，用户登录就能体验强大功能。对于视频内容创作者来说，这无疑是个好消息，他们能以更低成本和更高效率创作高质量视频内容。

随着Wan2.2-12V-Flash的推出，数字媒体和娱乐行业将迎来新的发展契机，相信会有更多精彩视频诞生，让我们一起期待。

详情查看：阿里通义重磅发布Wan2.2-I2V-Flash：图生视频效率飙升12倍，成本低至0.1元/秒！

Wan2.2-I2V-Flash

不止是搜索！百度PC端AI功能上线，一键搞定阅读写作PPT

在互联网信息爆炸的时代，搜索功能的强大与否直接影响用户体验。近日，百度搜索PC端首页全面上线一系列AI功能，将传统信息入口转变为任务中枢，给用户带来全新感受。

新上线的“超级智能双行框”十分厉害，用户能一键进行深度搜索，解答更复杂的问题，搜索效率大大提升。同时，百度还推出“工作台”模块，集成AI阅读、AI写作和AI PPT三大工具，方便用户日常工作和学习。

AI阅读功能很实用，用户一键就能总结链接、图片及超大文档，节省大量阅读和理解时间。AI写作工具提供超过20种文风选择，还支持划线修改，助力用户更好创作编辑。AI PPT功能则能根据全网内容自动生成演示文稿，满足用户演示需求。

根据QuestMobile发布的《2025年AI应用市场半年报》，百度AI搜索月活跃用户超3.22亿，稳居国内AI搜索行业第一。国际数据公司IDC报告也指出，百度AI搜索在中国通用型AI搜索类产品综合评分中位列第一，用户数据和技术能力都很强。

值得一提的是，用户可在“智能模式”和“经典模式”间自由切换，只有在“智能模式”下才能使用AI功能。这次升级提升了搜索效率，也展现了百度在AI技术上的创新发展，未来百度搜索值得期待。

详情查看：百度搜索PC端AI大升级：一键搞定复杂任务，3.22亿用户都在用！

百度AI搜索

通义千问Qwen Code：免费高额度，AI编程新宠来袭

在AI编程工具市场竞争激烈的当下，阿里云通义千问有了新动作。近日，其AI编程智能体Qwen Code宣布为用户提供每日2000次免费运行权限，且无Token限制，这一举措吸引众多开发者目光。

Qwen Code支持终端命令行形态，和Google的Gemini CLI、Anthropic的Claude Code以及OpenAI的Codex CLI等产品类似。不过，它有自己独特优势，免费额度更慷慨，安装流程更便捷。

和直接竞争对手Google Gemini CLI相比，Gemini CLI每日仅提供1000次调用，操作还相对繁琐。而Qwen Code不仅不限制Token，每分钟还有60次API调用政策，用户只需简单账户验证，通过一行命令就能快速安装使用。

阿里云此举旨在降低开发者使用AI编程工具门槛，吸引更多用户。同时，官方还在GitHub上为开发者提供丰富资源和支持，构建开发者生态。

Qwen Code的推出让AI编程工具市场竞争更激烈。阿里云凭借免费策略和优化用户体验，努力抢占市场份额，尤其在中国大陆地区，高额免费调用权限对开发者有很大吸引力。相信未来Qwen Code会不断完善，给开发者带来更多便利。

详情查看：阿里云放大招！通义千问Qwen Code每日免费2000次调用，开发者狂喜

通义千问Qwen Code

昆仑万维SkyReels-A3模型：让照片“开口说话”的神奇利器

在数字内容创作领域，创新技术不断涌现。近日，昆仑万维集团宣布推出最新技术成果SkyReels-A3模型，为该领域带来新突破。

SkyReels-A3是基于DiT视频扩散模型的音频驱动数字人创作工具，能实现任意时长全模态音频驱动数字人创作。它的核心功能超神奇，上传人像图片和相应语音，就能让图片中人物按语音开口说话或唱歌。还能创作新视频内容，用户提供人像图片、语音和文字提示，就能生成符合要求的表演视频。此外，它还能为现有视频“改台词”，自动匹配新口型、表情和表演，保持画面连贯。

该模型在多方面优化提升，支持长达60秒单分镜视频输出，多分镜支持无限时长，满足不同创作需求。针对线上直播等场景优化，提高视频生成一致性和交互动作自然度清晰度。

昆仑万维引入基于ControlNet结构的镜头控制模块，实现帧级别精准运镜控制，预设8种常见运镜参数，用户可按需选择，每个运镜强度还能0 - 100%连续调节，生成专业运镜效果。

SkyReels-A3的推出，为广告、直播带货等商业应用和音乐MV、电影片段等艺术创作提供更多可能，预示数字内容创作将更高效便捷，未来值得期待。

体验地址：SkyReels昆仑万维AI短剧平台（海外网站需要科学上网）

详情查看：昆仑万维SkyReels-A3模型发布：照片开口说话，视频创作“一键改台词”

昆仑万维SkyReels-A3模型

xAI放大招：Grok4 AI模型永久免费，AI平民化时代来了

在人工智能领域，xAI公司近日宣布一则重磅消息：Grok4人工智能模型将对全球所有用户永久免费开放，这一决定引发广泛关注。

Grok4的免费开放可不是试用或限时优惠，而是真正的永久免费。xAI为用户提供两种使用模式，Auto模式下，系统会根据问题复杂度自动判断是否用Grok4高级推理；Expert模式下，用户可让每个查询都通过Grok4处理。而且，在限定时间内还有慷慨使用限额，让用户充分探索潜力。

这一消息发布后，引发网友热烈讨论。有人认为Grok4免费将使其在全球称霸，也有人期待Grok5年底发布，还有人担心服务器承载能力。

值得注意的是，此宣布紧随OpenAI发布GPT-5之后，GPT-5反响平平，xAI此举被认为是在利用机会占据AI领域主导地位，策略时机把握精准。

Grok4永久免费，为用户提供强大AI工具，也为AI技术发展注入新活力。随着全球用户探索应用，未来AI领域发展将更多元化丰富。相信在xAI推动下，AI技术会更好地服务人类，创造更多可能。

体验地址：Grok4 AI网页版官网地址（海外网站需要科学上网）

grok4

Windows 11 Copilot牵手GPT-5：免费低限，开启智能新体验

在智能应用领域，微软又有新动作。近期，微软宣布Windows11（以及Windows10）中的Copilot应用全面支持由GPT-5驱动的智能模式，自8月7日起推出，在美国等地广泛可用。

Copilot应用撰写框采用“Web路由”技术，能自动识别提取Azure中的新模型，用户无需更新应用就能启用“智能”或GPT-5模式。和OpenAI的ChatGPT相比，Copilot使用限制更宽松。ChatGPT免费账户切换到较弱模型前，最多向GPT - 5发送10条提示，而Copilot更慷慨。

GPT-5具备推理支持，能自动决定是否推理并路由查询到“思考”端。ChatGPT免费账户每日仅一条思考消息，付费的ChatGPT Plus每月需支付20美元才有更高发送限制，Copilot则表现不同。测试中，Copilot的GPT - 5智能模式使用率高，一天内切换到“思考”模式达五次，还能准确回答复杂问题，成功请求GPT - 5思考。

使用Copilot访问GPT-5很简单，在浏览器打开copilot.microsoft.com或在PC端Microsoft Store下载应用，登录微软账户，智能模式自动激活。若未看到，稍等片刻即可。相信这一功能会给用户带来全新智能体验。

体验地址：GPT-5官网入口（海外网站需要科学上网）

Windows 11 Copilot