Wan2.5-Preview发布:原生多模态架构,实现电影级视频与音频同步生成
在AI视觉生成领域,Wan2.5-Preview的发布引起了广泛关注。这款新模型采用原生多模态架构,能灵活处理文本、图像、视频和音频的输入输出。通过联合训练,实现了模态间的深度对齐,让视听同步更精准。
其视频生成功能十分强大。不仅能原生支持高保真视频生成,还能同步生成多人声、音效和背景音乐。用户可利用文本、图像和音频进行创意组合,生成的电影级1080p高清10秒视频,动态和结构稳定性极佳,还升级了电影控制系统,能创作出有电影美感的作品。
在图像生成和编辑方面,Wan2.5-Preview也有显著提升。它能更好地遵循指令,生成逼真图像、多样艺术风格、创意排版和专业图表。图像编辑支持对话式操作,可实现像素级精度,完成多概念融合等复杂任务。
Wan2.5-Preview的发布,标志着AI视觉生成技术迈向新高度。它强大的多模态能力和精确控制功能,为开发者和创作者提供了前所未有的工具,有望推动AI视觉生成在更多领域的应用,为行业带来新的发展机遇。
体验地址:通义万相网页版官网
Figma MCP官方远程服务器全新升级:一键设计转代码超便捷
9月23日,Figma推出了官方远程MCP服务器,给设计开发领域带来了变革。这一创新工具摆脱了对Figma客户端的依赖,让AI编码代理能无缝接入设计上下文。
此次升级亮点颇多。无需客户端的远程访问功能,用户只需在支持的AI工具中添加服务器URL并授权,就能随时调用设计数据,特别适合分布式团队。与Figma Make无缝集成,能直接从Make文件提取资源,将交互原型转化为代码级资产。Code Connect UI组件映射优化,新增原生映射界面,方便用户关联设计组件与前端代码库。
接入过程也很简单,专业版及以上用户启用服务器后,在AI工具中添加配置并授权,粘贴Figma链接就能生成代码。不过免费版用户暂无法使用。
Figma MCP服务器的升级解决了设计开发脱节的问题。过去手动“翻译”设计稿耗时费力,现在AI成为桥梁,尤其在组件密集型项目中,前端开发者可一键生成高还原代码。这不仅加速了从原型到产品的流程,还标志着设计系统与前端开发的深度融合,引领行业进入“零摩擦”协作新时代,未来有望推动“vibe coding”成为主流。
详情查看:Figma MCP服务器正式上线!
杭州云栖大会上阿里CEO吴泳铭指出:AI未来迈向超级人工智能ASI,路线图曝光
在杭州云栖大会上,阿里巴巴集团CEO吴泳铭发表演讲,阐述了AI未来发展战略。他指出,通用人工智能(AGI)并非终点,人类目标是发展出能自我迭代、全面超越人类的超级人工智能(ASI)。
吴泳铭将通往ASI的道路分为三个阶段。第一阶段是“智能涌现”,AI通过学习海量知识具备泛化智能;第二阶段是“自主行动”,AI掌握工具使用和编程能力辅助人类,目前行业正处于此阶段;第三阶段是“自我迭代”,AI通过与物理世界交互和自主学习超越人类。
为实现这一目标,阿里云有明确战略路径。打造“AI时代的Android”,通义千问走开源开放路线,构建开发者生态;构建“下一代计算机”,打造超级AI云,提供智能算力网络。阿里巴巴还推进三年3800亿的AI基础设施建设计划,并承诺持续追加投入。
吴泳铭认为,AI将成为下一代操作系统,超级AI云是下一代计算机。未来人类和AI将协同工作,AI放大人类智力,推动科技飞跃,引领我们进入前所未有的智能时代。这一战略愿景为AI发展指明了方向,也让我们对未来智能世界充满期待。
详情查看:阿里CEO吴泳铭揭秘:AI终极目标不是AGI,而是“超越人类”的超级智能路线图
告别手动记账:ReceiptHero以AI图像识别技术,实现收据数字化与智能分类
在财务管理领域,ReceiptHero这款AI记账工具正悄然改变人们的生活。它彻底颠覆了传统记账方式,让记账变得轻松简单。
ReceiptHero的厉害之处在于其强大的AI图像识别技术。用户只需用手机拍摄小票照片,它就能瞬间将纸质凭证转化为数字化记录,精准解析小票上的日期、金额、商户名称等信息。即使是皱巴巴或模糊的小票,识别准确率也高达95%以上。
它不仅能识别提取信息,还能自动进行智能分类,将水电费、餐饮等支出精准归类,省去用户反复输入和分类的麻烦。系统生成的可视化报表,让用户清楚了解自己的消费情况,包括总花费、消费类别、消费时间等,使月度预算审视和支出趋势追踪变得轻松。
ReceiptHero功能集成出色,支持数据导出到Excel或会计软件,能与银行卡交易记录联动,还能生成专业PDF报告,满足日常报销和税务申报需求。而且操作无需下载额外应用,使用门槛极低。
此外,它还能关联支付交易记录验证数据,确保真实可靠,防范AI伪造收据风险。并且能主动分析消费模式,提供财务建议,帮助用户培养理财意识。ReceiptHero的出现,标志着AI技术在财务管理领域的重要转变,为行业树立了新标杆。
详情查看:AI记账黑马ReceiptHero爆火!拍照3秒生成账单,95%识别率让手动记账彻底“退休”
阿里云发布新一代旗舰超大AI大模型Qwen3-Max:万亿参数,多项基准测试全球前三
在人工智能竞争激烈的当下,阿里云推出了超强AI大模型Qwen3-Max,给业界带来新的震撼。
通义千问Qwen3-Max是通义团队规模最大、能力最强的产品,参数总数超1万亿。其Qwen3-Max-Instruct版本在代码能力和智能体表现上有了质的飞跃,在知识推理、编程能力、指令遵循和多语言理解等多个领域处于行业领先水平。还有一个正在训练的Qwen3-Max-Thinking版本,在高难度推理测试中取得100%准确率,潜力非凡。
训练方面,Qwen3-Max预训练使用了36万亿个tokens,独特的MoE模型结构设计让训练稳定高效。通过PAI-FlashMoE优化,训练效率显著提高,能支持长达1M的上下文训练,还通过多种技术手段降低硬件故障带来的时间损失。
实际应用中,Qwen3-Max-Instruct表现出色。在LMArena的文本排行榜上稳居全球前三,超越了GPT-5-Chat;在SWE-Bench Verified基准测试中取得69.6的高分,显示卓越编程能力;在Tau2-Bench测试中以74.8分超越Claude Opus4和DeepSeek-V3.1。
阿里云的Qwen3-Max不仅技术参数领先,应用性能也强大,为人工智能未来发展注入新动力,有望在更多领域发挥重要作用,推动行业进步。
体验地址:通义千问官网--Qwen Chat--Qwen3-Max
夸克发布AI创作平台“造点”,集成Midjourney V7与通义万相Wan2.5,实现音画同步生成
9月24日,阿里巴巴AI旗舰应用夸克发布全新AI创作平台“造点”,为用户带来一站式创作体验。
“造点”平台集成了AI生图与AI生视频两大核心能力,率先接入通义万相Wan2.5,成为国内首个支持音画同步视频生成的平台。在生图方面,引入全球领先的图像生成模型Midjourney V7,结合夸克自研技术,在亚洲人像生成、中文文字生成、国风元素等方面表现突出,适用于电商、平面设计及影视游戏等场景。
对通义万相Wan2.5的集成是平台亮点。它能生成和画面匹配的人声、音效和背景音乐,支持10S时长、24帧/秒的1080P高清视频,画面质量满足电影级场景创作需求,指令遵循能力强,可完成运镜等复杂控制。
内测期间,“造点”吸引了大量专业AIGC创作者,诞生了众多爆款作品。创作者反馈,Midjourney生成图片,配合Wan2.5生成视频,画质细腻稳定,音频视频同步输出,大大提升了创作效率。
目前,用户可通过多种方式进入“造点”平台,即日起至9月30日,所有用户可限时7天免费体验通义万相Wan2.5的视频生成能力。在夸克APP端,“造点”还提供轻量化创作体验,满足普通用户需求,支持多种趣味玩法和热门AI场景。
工具地址:夸克造点AI创作平台
Suno发布v5模型:人声表现力与音频控制能力显著提升,迈向专业音乐生产工具
9月23日,人工智能音乐生成平台Suno发布v5模型,为AI音乐创作带来新突破。
Suno v5专供Pro和Premier订阅用户使用,目标是提供更具沉浸感的音频体验、更逼真的人声和更强大的创意控制能力。官方宣称其拥有“世界上最好的音乐能力”,能带来更清晰的音频输出、像人类般自然的声乐以及对音乐元素的精细掌控,标志着AI音乐从简单文本生成向专业生产工具转变。
该模型在多个核心技术领域取得显著飞跃。音频质量上,音压和空间感大幅增强,生成的音乐更具专业水准;人声表现力方面,基本消除了“机器人感”,情感丰富、富有表现力;精确控制与混音能力也得到优化,用户能更精确控制节奏、乐器和歌曲结构,轻松实现二重唱或多声部合唱。
早期测试者对v5的“提示遵守度”给予高度赞扬,指定一分钟歌曲长度的成功率高达90%,废弃率极低。
Suno紧随5月发布的v4.5之后推出v5,进一步巩固了其在AI音乐生成领域的领先地位。Pro和Premier订阅用户可将作品用于商业用途,免费版限于非商业用途。9月25日,Suno还将推出配套工具Suno Studio,助力创作者深入创作,加速音乐创作民主化进程。
体验工具:Suno V5网页版官网入口 (需要科学上网)
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: