• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

阿里放大招EMO:一张照片+音频即可生成会说话唱歌的视频!

阿里放大招EMO:一张照片+音频即可生成会说话唱歌的视频!
AI TOP100
2024-02-28 17:45:01

阿里放大招了!

EMO:一张照片+音频即可生成会说话唱歌的视频 你只需要提供一张你的照片+任意的音频文件,就能实现你说任何话或唱任何歌曲的动态视频。

同时生成视频的长度和你音频长度相匹配! 表情非常到位,支持任意语音、任意语速、任意图像...

阿里EMO主要特点和功能

1、音频驱动的人像视频生成: 利用单张参考图像和音频输入(如说话或唱歌),EMO能够生成具有表情变化和头部动态的虚拟人像视频。这意味着用户可以通过提供一张静态图片和相应的音频文件,来创造出说话或唱歌的动态视频。无论视频中的人物进行怎样的表情变化或头部动作,其基础特征都来源于这张参考图片。

2、表情丰富的动态渲染: EMO特别强调在视频中生成自然而富有表情的面部动作,能够捕捉到音频中情感的细微差别,并将其反映在人像的表情上,从而生成看起来自然、生动的面部动画。

3、多头部姿势支持: 除了面部表情外,EMO还能够根据音频生成多样的头部姿势变化,增加了视频的动态性和真实感。

4、支持多种语言和肖像风格: 该技术不限于特定语言或音乐风格,能够处理多种语言的音频输入,并且支持多样化的肖像风格,包括历史人物、绘画作品、3D模型和AI生成内容等。

5、快速节奏同步: EMO能够处理快节奏的音频,如快速的歌词或说话,确保虚拟人像的动作与音频节奏保持同步。

6、跨演员表现转换: EMO能够实现不同演员之间的表现转换,使得一位演员的虚拟形象能够模仿另一位演员或声音的特定表演,拓展了角色描绘的多样性和应用场景。


项目地址:https://humanaigc.github.io/emote-portrait-alive/…

论文:https://arxiv.org/abs/2402.17485

GitHub:https://github.com/HumanAIGC/EMO

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 每日AI资讯-2025年11月20日

  • 知乎x盐言故事:漫剧创作者激励计划

  • 5000+全球参会者见证!XIN峰会圆满收官,赋能新一代创新力量从南山走向世界!

  • Meta发布SAM3D模型:通过单张图片生成带纹理的3D资产

  • 中国好创意暨全国数字艺术设计大赛:即梦AI AIGC创作专项大赛

热点资讯

Google Gemini 3.0 即将震撼发布!百万级上下文+全模态推理引领AI新时代

2天前
 Google Gemini 3.0 即将震撼发布!百万级上下文+全模态推理引领AI新时代

2025年11月18日重磅!蚂蚁集团灵光App震撼上线,30秒生成应用不是梦

2天前
2025年11月18日重磅!蚂蚁集团灵光App震撼上线,30秒生成应用不是梦

AI漫剧广告消耗激增,巨量引擎日均投放达千万级

2天前
AI漫剧广告消耗激增,巨量引擎日均投放达千万级

xAI推出Grok 4.1:免费升级,性能飙升,能否撼动AI模型格局?

2天前
xAI推出Grok 4.1:免费升级,性能飙升,能否撼动AI模型格局?

夸克重磅推出千问助手,阿里千问App公测上线,AI生活加速到来!

3天前
夸克重磅推出千问助手,阿里千问App公测上线,AI生活加速到来!
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有