• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

每日AI资讯-9月20日

每日AI资讯-9月20日
AI TOP100
2024-09-20 10:02:56

快手可灵AI发布1.5版本 视频更稳更高清 人飞了脸都没崩

来源:站长之家

可灵AI最新发布的1.5版本带来了令人印象深刻的新功能和改进,显著提升了视频生成的数量和质量,拓宽了AI在创意媒体领域的应用边界。画质大幅提升,支持10秒1080p高清视频,文本响应度提升,审美提升,人物一致性加强,物体一致性改善。

可灵AI视频工具官网:【点击登陆】

可灵AI发布1.5版本 视频更稳更高清 人飞了脸都没崩

字节推音乐生成神器 Seed-Music 支持多样化输入和精确控制

来源:站长之家

最近,字节跳动推出了音乐创作新工具 Seed-Music,让用户通过多种方式生成音乐,如文字描述、音频参考、乐谱甚至语音提示。这一神奇模型结合自回归语言模型和扩散模型,生成高质量音乐作品,同时提供精确控制。用户可配乐歌词、改编旋律,甚至上传语音片段转化为歌声,功能强大且高效。

字节推音乐生成神器 Seed-Music 支持多样化输入和精确控制

阿里通义万相视频生成模型“AI生视频”功能正式上线

来源:站长之家

阿里巴巴旗下通义推出的通义万相AI生视频模型正式上线,具有强大的画面视觉动态生成能力,支持多种艺术风格和影视级质感的视频内容生成。该模型优化了中式元素表现,支持多语言输入和可变分辨率生成,应用场景广泛,提供免费服务并具有音频生成功能,简化视频制作流程。

阿里通义万相视频生成模型“AI生视频”功能正式上线

腾讯出品!AI音频模型 EzAudio AI,让文本秒变逼真声音

来源:站长之家

近日,约翰霍普金斯大学与腾讯 AI 实验室联合推出的 EzAudio 模型标志着音频技术的重大进步。该模型通过创新的架构和技术生成高质量音频样本,具备广泛的应用潜力。随着技术的发展,伦理和责任使用问题逐渐突显,EzAudio 的公开研究代码也为未来的风险与收益提供了广泛的检验机会。

腾讯出品!AI音频模型 EzAudio AI,让文本秒变逼真声音

ChatGPT 高级语音模式或将于9月24日全面上线

来源:站长之家

ChatGPT的高级语音模式即将于9月24日全面发布,为用户带来前所未有的交互体验。该功能生成逼真音频响应,提升人机交互自然度和沉浸感。更新信息可靠性得到佐证,部分移动用户或将在9月24日体验升级后的语音模式。macOS版ChatGPT应用界面有变化,语音模式界面更丰富,新增便捷按钮。部分用户可与ChatGPT共享更多上下文信息,实现更连贯和个性化对话体验。

ChatGPT 高级语音模式或将于9月24日全面上线

开发者福音!Anthropic将推出Claude AI桌面应用

来源:站长之家

Anthropic即将推出全新的Claude AI桌面应用,为开发者带来更便捷的AI助手体验。这将极大提高开发效率和创新可能。

开发者福音!Anthropic将推出Claude AI桌面应用

阿里CEO称AI最大想象力不在于手机:通义千问API调用价格下降97%

来源:站长之家

在2024年云栖大会上,阿里巴巴集团CEO吴泳铭发表演讲,提出AI的最大潜力不在于手机屏幕,而在于改变物理世界。他指出,AI发展迅速,已能完成复杂编程任务,并在多学科领域达到高水平。吴泳铭认为,未来AI将渗透数字世界,改变物理世界,每个家庭可能拥有多个机器人,提高生活效率。他还强调了生成式AI的重要性,认为它将推动新的产业革命,并导致计算架构的根本性变化。

通义千问官方地址:【点击登陆】

阿里CEO称AI最大想象力不在于手机:通义千问API调用价格下降97%

Runway进军好莱坞!与狮门影业达成合作

来源:站长之家

Runway与著名电影制作公司Lionsgate达成合作,开发定制AI视频模型,引发影视行业震动。这次合作将为影视制作领域带来新突破,提升制作效率和创意发挥空间。

runway官网地址:【点击登陆】

Runway进军好莱坞!与狮门影业达成合作

智谱开源图生视频模型 CogVideoX - 5B - I2V

来源:ITSoul

智谱开源图生视频模型CogVideoX - 5B - I2V及其标注模型cogvlm2 - llama3 - caption。CogVideoX - 5B - I2V支持“一张图”加“提示词”生成视频,cogvlm2 - llama3 - caption负责将视频内容转成文本描述。网友对CogVideoX - 5B - I2V的评价褒贬不一,实测中该模型存在一些问题,如生成速度慢、效果不理想等,但团队也展示了一些成功作品。有三大技术亮点:一是团队自研高效的3D VAE结构,可大幅减少训练成本和难度,模型结构包含多个部分,训练分两阶段且损失函数结合多种损失;二是专家Transformer,将视频和文本嵌入拼接后送入专家Transformer块堆栈处理再解码重建视频;三是数据方面,开发负面标签排除低质量视频,标注筛选20000个视频数据点,调整阈值确保质量,还提出从图像字幕生成视频字幕的管道并微调相关模型以获得更密集字幕,加速视频字幕生成过程。  大家也可以前往智谱清影和API平台体验更大规模的商业版视频生成模型

智谱清影AI官网地址:【点击登陆】

开源地址:

https://github.com/THUDM/CogVideo/blob/main/README_zh.md

https://huggingface.co/THUDM/CogVideoX-5b-I2V

体验地址:

https://huggingface.co/spaces/THUDM/CogVideoX-5B-Space

智谱开源图生视频模型 CogVideoX - 5B - I2V

想了解更多AI行业资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 可灵AI
  • 通义千问
  • ChatGPT
  • 智谱清影
  • 智谱清言
相关资讯
  • 每日AI资讯-2025年11月26日

  • 每日AI资讯-2025年11月25日

  • 每日AI资讯-2025年11月24日

  • AITOP100上线谷歌Nano-Banana Pro模型:玩法超多,创意无限!

  • 每日AI资讯-2025年11月21日

热点资讯

2025年11月18日重磅!蚂蚁集团灵光App震撼上线,30秒生成应用不是梦

9天前
2025年11月18日重磅!蚂蚁集团灵光App震撼上线,30秒生成应用不是梦

Google Gemini 3.0 即将震撼发布!百万级上下文+全模态推理引领AI新时代

9天前
 Google Gemini 3.0 即将震撼发布!百万级上下文+全模态推理引领AI新时代

谷歌NotebookLM迎来史诗级更新!PPT制作神器Slide Decks正式上线,效率起飞!

5天前
谷歌NotebookLM迎来史诗级更新!PPT制作神器Slide Decks正式上线,效率起飞!

AI漫剧广告消耗激增,巨量引擎日均投放达千万级

8天前
AI漫剧广告消耗激增,巨量引擎日均投放达千万级

xAI推出Grok 4.1:免费升级,性能飙升,能否撼动AI模型格局?

9天前
xAI推出Grok 4.1:免费升级,性能飙升,能否撼动AI模型格局?
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有