生数科技Vidu Q2:细微表情让AI视频更逼真
生数科技在9月25日推出了新一代图生视频大模型Vidu Q2,这款模型聚焦“细微表情生成”,给用户带来全新视觉体验。
Vidu Q2的厉害之处在于能精准捕捉极致表情变化,还结合推拉运镜技术,提升了视频生成速度和语义理解能力。在生成的视频里,AI模拟的面部表情自然流畅,镜头移动灵活,每一帧画面都饱含情感。
为满足不同用户需求,Vidu Q2提供丰富模式。有图生视频、首尾帧视频,时长还能在2 - 8秒内调整。用户还能选择电影大片风格或快节奏闪电出片,让创作轻松又有趣,大大提升了创作者的自由度。
生数科技推出Vidu Q2,旨在让AI技术更好地服务创意产业,让每个用户都能轻松制作高质量影像作品。随着AI在各领域广泛应用,Vidu Q2为图生视频技术发展注入新动力。
未来,它有望在更多领域展现潜力,助力创作者实现更高水平的艺术表达,让个人和企业用户都能从中找到新可能,让AI真正服务于人类创造力。
体验地址:Vidu AI网页官网入口
火山引擎炉米Lumi:首次支持豆包、即梦等同款视觉模型的Lora微调功能
近日,火山引擎推出炉米Lumi平台,首次支持豆包、即梦等同款视觉模型的Lora微调功能,助力企业高效定制独特视觉风格。
在Vibe Coding时代,视觉和审美愈发重要,但企业用通用模型创作常面临精准匹配难、开源模型效果不一、部署流程长等问题。炉米Lumi平台基于丰富定制经验,提供从图片到视频生成的全流程服务。它支持ComfyUI等开源生态,还独家开放字节跳动同款视觉大模型的Lora微调训练。企业通过轻量化Lora模型就能深度改造,降低定制门槛和成本。
目前,Lumi平台已在抖音等30多个字节跳动核心业务线稳定运行,助力企业构建专业场景的定制化AIGC生产能力,像IP角色定制等场景效果显著。此外,平台提供一站式AIGC生产力解决方案,满足企业创作启动和成果落地需求,让企业快速适应市场变化。未来,火山引擎将持续开放最新功能,推动AI在各行业智能化升级,助力企业实现更大突破。
工具地址:炉米Lumi官网平台
CWM代码模型上线:Meta用沙箱模拟减少代码错误,提升开发效率
Meta近日推出创新的代码世界模型CWM,这是一个拥有32B参数的AI系统,能深度理解代码世界,具备高级生成和推理能力。
与传统代码模型不同,CWM在生成代码前会先在沙箱环境模拟推演,预测代码运行后果并带着目的执行任务。这带来诸多优势:能减少代码潜在错误和陷阱,在开发早期发现;可智能调试,快速查明问题代码行或变量;还能在运行命令前预警可能后果。
不过,CWM对硬件要求极高,需要160GB的VRAM,这意味着用户要配置双H100GPU,并配备RDMA技术才能运行。
Meta推出的CWM代码模型,以其独特的运行机制和强大功能,为代码生成和调试带来了新的思路和方法。虽然硬件要求高,但随着技术发展,未来或许会有更多优化和解决方案。相信在不久的将来,CWM将在代码领域发挥重要作用,推动代码开发向更高效、更准确的方向发展,为开发者带来更多便利。
详情查看:Meta上线320亿参数代码模型CWM
阿里云通义千问开源超300模型,下载量破6亿,引领AI技术共享潮流
在2025云栖大会上,阿里云CTO周靖人透露,通义千问项目已开源超300个模型,下载量突破6亿次,展现出强大影响力和用户认可度。
通义千问模型涵盖全尺寸、全模态,能满足不同用户需求。阿里云希望通过开源模型,为各行业AI应用提供便利,推动技术创新和应用落地。此次大会还发布多款新模型,彰显其前进决心。同时,通义万象项目成果丰硕,生成超3.9亿张图片和7000多万个视频,潜力巨大。
周靖人表示,未来阿里云会继续研发推广AI技术,与更多开发者和企业合作。在当前AI技术飞速发展背景下,通义千问的开放共享为行业注入新活力。阿里云不仅技术领先,还在生态建设上积极开拓,吸引众多开发者加入AI应用探索。其努力推动了自身业务增长,也为行业技术进步和创新创造条件。相信未来阿里云会带来更多惊喜,在AI领域创造更多可能。
体验地址:通义千问网页版官网平台
英伟达AI面部动画模型Audio2Face开源:实时面部动画生成新利器
近日,英伟达开源生成式AI面部动画模型Audio2Face,包含核心算法、SDK和完整训练框架,加速游戏和3D应用中智能虚拟角色开发。
Audio2Face能分析音频中的音素、语调等声学特征,实时驱动虚拟角色面部动作,实现精确口型同步和自然情感表情。它适用于游戏、影视制作和客户服务等多个领域。
该模型支持离线渲染和实时流式处理两种模式。为方便开发者,英伟达开源多个关键组件,如Audio2Face SDK、适用于Autodesk Maya和Unreal Engine5.5及以上版本的插件,还开源回归模型和扩散模型,开发者可微调模型适应特定场景。
目前,多家游戏开发商已采用该技术。Survios在游戏中集成后简化流程,Farm51工作室应用后节省制作时间,提升角色真实感和沉浸体验。英伟达此举为开发者提供更多创作工具,推动虚拟角色表现发展。
未来,我们有望在更多作品看到更真实生动的角色。
详情查看:英伟达正式开源AI面部动画模型Audio2Face
阿里瓴羊发布AI智能体服务平台AgentOne:助力企业变身“超级公司”
在云栖大会上,阿里巴巴旗下瓴羊发布企业级AI智能体服务平台AgentOne,推动企业从被动响应向主动智能转型,助力成为AI时代“超级公司”。
AgentOne聚焦“数据密集、资金密集、人力密集”核心场景,已成功“上岗”超20种企业级Agent,企业可自主使用。它构建融合企业自身数据、模型、平台能力的AI训练场,以电商品牌为例,能深度整合阿里生态能力,驱动业务增长。此外,还将联合第三方生态推出更多专业化Agent,构建开放生态。
瓴羊CEO朋新宇称企业级Agent是未来组织标配,提出核心公式。调研显示,企业推进AI应用面临技术、数据和组织三大挑战。AgentOne以多场景、好数据、强生态优势,提供系统性解决方案。
它强调AI价值在于融入业务流程,重构组织协作,带来可持续增长动能,为企业AI落地提供有力支持。
体验地址: https://neoladder.com/
Kimi K2模型再进化:“OK Computer”Agent模式支持网站开发、数据分析等任务
2025年9月25日,月之暗面推出全新Agent模式“OK Computer”,并开启灰度测试,这是Kimi K2模型在智能体和工具调用能力上的重要进步。
“OK Computer”延续“模型即Agent”理念,发挥Kimi K2模型优势。用户使用时,只需简单下达需求,Kimi就能自主操作虚拟电脑,完成网站开发、数据分析、图片视频生成和高质量PPT制作等复杂任务,提高工作效率。
Kimi K2模型自7月11日发布就备受关注,它采用MoE架构,参数总量达1T,激活参数32B。在自主编程、工具调用和数学推理基准测试中表现卓越,尤其在Agentic Coding方面突出。
此次灰度测试邀请打赏用户作为首批体验者,让他们感受科技魅力,也为Kimi收集反馈优化产品。相信随着不断优化,“OK Computer”将为用户带来更智能、便捷的服务体验。
体验地址:Kimi AI网页版官网入口
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: