每日AI资讯-11月13日-AITOP100,AI资讯

生数科技Vidu 1.5引领AI视频生成新纪元

2024年11月13日，生数科技宣布震撼发布Vidu 1.5版本，标志着全球首个多主体一致性多模态大模型的诞生。Vidu 1.5的问世，为AI视频制作领域带来了革命性的技术突破。

Vidu 1.5的核心亮点在于其多主体一致性生成能力，能够理解和整合人物、物体、环境等多个概念，并在30秒内根据用户指令生成多个主体融合的视频结果，实现视频创作中的多主体一致性。此外，Vidu 1.5还提供了全球首个支持“主体参照”能力的AI视频大模型，确保视频生成中的一致性和可控性，不局限于单一对象，而是面向“任意主体”。

在视频生成方面，Vidu 1.5通过“上传主体图+输入场景描述词”的方式，直接生成视频素材，这一创新方法大幅减少了工作量，同时打破了分镜头画面对视频内容的限制。生数科技CEO唐家渝表示，这一功能的上线代表着AI完整叙事的开端，预示着AI视频创作将迈向更高效、更灵活的阶段。

Vidu 1.5的发布，不仅展示了生数科技在AI视频生成技术上的领先地位，也为整个行业的发展指明了新的方向。随着AI技术的不断进步，Vidu 1.5有望成为影视、动漫、广告等多个行业的创新引擎，推动AI视频生成技术进入一个新的发展阶段。

了解详情： https://www.aitop100.cn/infomation/details.html?id=19444

字节跳动发布SeedEdit，革新AI图像编辑体验

来源：小互

字节跳动旗下豆包大模型团队近日发布了一款名为SeedEdit的全新通用图像编辑模型，标志着AI图像编辑技术的新突破。SeedEdit模型通过自然语言指令，为用户提供了前所未有的图像编辑体验。该模型能够理解并执行修图、换装、美化、风格转换等多样化的编辑指令，甚至能在指定区域内添加或删除元素。

SeedEdit的创新之处在于，用户无需具备专业的图像处理技能，只需通过简单的文本指令，如“将背景换成海边”，便可轻松完成复杂的图像编辑工作。这一特性极大地降低了图像编辑的门槛，使更多用户能够享受到个性化编辑的乐趣。

在编辑过程中，SeedEdit能够很好地保留原图的风格和质量，确保编辑后的图像既符合用户的期望，又保持自然美观。SeedEdit的设计理念在于平衡原始图像信息与新生成图像之间的关系，这使得模型在处理复杂指令时能够保持更高的稳定性和生成质量。

目前，SeedEdit已在豆包PC端及即梦网页端开启测试，用户可以在生成图片后，通过简单的文本指令对图片进行快速编辑，实现一键式改图。SeedEdit的推出，预示着图像处理领域即将迎来一场由自然语言驱动的革命性变革。

工具详情： https://www.aitop100.cn/tools/detail/1802.html

Suno V4音乐生成模型引领AI音乐新高度

来源：AITOP100

近日，Suno公司发布了其最新V4版本AI音乐生成模型的音频样本，预示着音乐生成技术的重大进步。Suno V4模型通过深度学习技术对大量音乐数据进行训练，旨在生成更自然、更丰富的音乐作品。与以往版本相比，V4模型在音频合成方面的表现更为出色，能产生更具表现力的乐曲，增强了音乐的情感表达。

Suno V4的关键特性包括增强的音质和多样性，以及一致的音乐风格人物。V4模型展现出显著的音质和多样性提升，通过深度学习技术生成更自然和富有表现力的音乐作品。此外，V4引入了“人物”功能，使用户能够在多首歌曲中保持风格的一致性，提高用户满意度。

Suno V4模型不仅适用于个人创作，还可以被广泛应用于商业音乐制作、游戏音乐及其他需要背景音乐的场合，推动AI音乐生成技术的进一步普及和应用。随着这一技术在法律挑战中不断进步，它将如何影响艺术家和整个音乐行业的格局将非常值得关注。Suno V4的发布，标志着AI音乐生成技术的一个令人兴奋的里程碑，提供了增强的功能，使用户能够以前所未有的方式探索他们的音乐创造力。

工具详情： https://www.aitop100.cn/tools/detail/1886.html

HeyGen开放API，赋能个性化视频创作

来源：HeyGen

HeyGen，这款由深圳诗云科技开发的AI视频生成平台，近日宣布对外开放其API，为视频创作者和开发者提供更多可能性。HeyGen的API接口支持第三方产品接入，使得用户可以程序化地创建令人惊叹的头像视频。

HeyGen的API功能强大，它允许用户通过编程方式访问HeyGen的深度学习算法，这些算法通过训练大量视频数据来学习各种视频特征和风格。用户只需提供文字描述、图像和音频等输入，HeyGen便能快速生成与输入内容相匹配的视频。

此外，HeyGen的API还提供了对声音的自定义功能，用户可以预览声音音频并探索HeyGen的声音库，以用于视频配音。用户可以根据视频的风格和感觉，调整声音的语调、音高、语速和情感强度，创造出独特的配音效果。

HeyGen的应用场景广泛，从市场营销、销售支持、客户服务到培训和内容创作等，都能见到其身影。其技术实力在智能客服、智能推荐、安防监控、自动驾驶等多个领域得到应用。

HeyGen的API开放，预示着AI视频生成技术将更加普及，为个性化和定制化的视频内容创作提供强有力的技术支持。这不仅是技术的进步，也是创意表达的新机遇。

工具详情： https://www.aitop100.cn/tools/detail/1822.html

全球首个人形机器人马拉松比赛将于2025年在北京经济技术开发区（北京亦庄）举行

来源：腾讯新闻

北京亦庄官方近日宣布，全球首个人形机器人马拉松比赛将于2025年在北京经济技术开发区（北京亦庄）举行。这场以“智能竞技亦马当先”为主题的赛事，由北京市经济和信息化局和北京经济技术开发区管委会指导，现面向全球机器人俱乐部征集人形机器人参赛。

此次比赛将设立包括完赛优胜奖、最优耐力奖、最佳人气奖在内的一系列奖项和奖金激励，以鼓励全球的人形机器人参与竞技。报名截止时间为2025年2月。在2024年北京亦庄半程马拉松中，人形机器人“天工”已经在起点和终点进行了表演，为跑者加油助威，并确定将于明年参赛。

“天工”人形机器人代表了北京在人形机器人技术领域的最新进展，它不仅能够进行拟人奔跑，而且实测平均时速可达每小时10公里，最高奔跑速度已提升至全球领先的每小时12公里。北京亦庄人形机器人马拉松比赛不仅是科技与体育竞技的激情碰撞，也是人形机器人应用的创新性探索，将成为北京亦庄乃至北京市的新名片。通过这一赛事，北京期待与更多人形机器人科研机构、企业和组织携手，共同打造具身智能与公众互动的标杆性案例，加快具身智能产业落地速度，共创人机共生的新纪元。

更多AI行业最新资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html