Fish Audio公司发布了Fish Agent V0.1 3B语音处理模型
来源:AITOP100
近日,Fish Audio公司发布了一款名为Fish Agent V0.1 3B的先进语音处理模型,标志着语音到语音模型领域的一大突破。这款模型以其高效、精确的语音生成和处理能力,特别擅长模拟和克隆不同的声音,为用户提供了“即时”语音克隆的新体验。
Fish Agent V0.1 3B模型的关键特性包括端到端架构,它采用了无语义层的真正端到端(E2E)架构,这意味着它可以直接在声音层面上处理和生成语音,无需传统的语义编码器/解码器。此外,该模型支持零样本语音克隆,即无需训练即可实现语音克隆,大大简化了语音处理流程。Fish Agent V0.1 3B使用30亿参数,便于开发和集成,同时保持了模型的高效性能。模型灵活地支持文本和音频输入,为用户提供了多样化的使用选项。超快响应时间是其另一大特点,Fish Agent V0.1 3B仅需200毫秒的文本到音频转换时间(TTFA),满足了实时语音生成的应用需求。
多语言支持也是Fish Agent V0.1 3B的一大亮点,模型支持包括英语、中文、德语、日语、法语、西班牙语、韩语和阿拉伯语等多种语言,覆盖了广泛的应用场景。基于约70万小时的多语言音频数据训练,使其在处理多种语言和语境时具备出色的适应性。
Fish Agent V0.1 3B模型的发布,将进一步推动AI语音技术的发展,为语音助手、虚拟人等应用带来更多可能性。其快速、自然的语音生成能力,使其成为实时语音生成应用的理想选择,如语音助手、自动客服以及其他需要快速语音反馈的场景。Fish Audio的Fish Agent V0.1 3B模型以其创新的架构和卓越的性能,为语音克隆和文本到语音转换领域带来了革命性的进步。随着该模型的开源,我们期待它将在AI语音技术的应用和发展中发挥重要作用。
资讯详情: https://www.aitop100.cn/infomation/details.html?id=19416
2024 AIGC创新创意作品征集大赛启动
来源:AITOP100
由教育部支持,人力资源和社会保障部与新华通讯社联合主办的“AIGC青年大学生就业创业促进行动”迎来了新高潮。作为行动的重要组成部分,AIGC创新创意作品征集大赛现已全面启动,面向全国青年大学生征集创新作品,旨在激发创新潜能,提供就业创业新机遇。
大赛以AIGC产业生态和应用场景为基础,通过“揭榜挂帅”和“赛马机制”选拔优秀作品,为青年大学生创造更多就业创业机会。大赛将搭建产投融研综合服务平台、AIGC产业园和数字内容基地,促进优秀项目落地和科技成果转移转化。
赛事设置四个赛道,不限专业,鼓励跨年级、跨专业自由组队。参赛者可围绕应用开发、文化创意、企业命题和AI理论等方向提交作品。其中,应用开发赛道聚焦基于大模型相关技术的应用产品或解决方案;文化创意赛道围绕“AIGC+文化”开展征集,包括文化内容生成创作作品;企业命题赛道针对企业创新需求,面向行业组织和头部企业征集命题;AI理论赛道则围绕人工智能领域开展青年优秀论文征集。
本次大赛不仅是一场创意与技术的较量,更是一次青年大学生展示自我、实现梦想的舞台。通过大赛,青年大学生将有机会与行业专家、企业领袖面对面交流。同时,优秀作品将有机会获得投资支持和市场推广,加速科技成果的商业化进程。
报名及作品提交截止日期为2024年12月1日,执委会组织专家完成初赛和复赛评审后,决赛将采取现场路演与答辩的方式进行,举办地为深圳市南山区。大赛为参赛者提供了一个展示才华、实现创新梦想的平台,同时也为AIGC领域的技术发展和应用创新注入了新的活力。
活动详情: https://www.aitop100.cn/infomation/details.html?id=19417
Midjourney 即将推出视频生成功能
来源:推特
近日,推特社交媒体传闻,Midjourney即将推出其最新的视频生成功能,标志着该平台在AI创作领域的又一次重大突破。这项新功能允许用户通过简单的文本提示生成视频内容,进一步扩展了AI在数字媒体创作中的应用范围。
核心功能与特点:
Midjourney视频的核心功能是依据文本提示自动生成视频,这一过程无需复杂的手动编辑技能,使得视频创作变得更加便捷和高效。用户可以通过Discord上的机器人集成使用这项功能,并通过各种参数如--video
进行定制化操作。
Android版Suno开放预注册
来源:Suno
音乐AI创作平台Suno AI近日宣布,其Android版本现已开放预注册,这标志着该平台在移动设备上的应用即将成为现实。Suno AI以其创新的AI技术,让音乐创作变得更加简单、有趣和个性化,现在Android用户也能享受到这一便利。
Suno AI平台允许用户通过输入简单的文本提示词,即可根据流派风格和歌词生成带有人声的歌曲。该AI音乐生成器由来自Meta、TikTok、Kensho等知名科技公司的团队成员开发,目标是让所有人都能创造美妙的音乐,无需任何乐器工具。
核心特点:
1. 易于操作:用户只需描述所追求的音乐风格,Suno AI将自动完成创作过程,生成新颖的音乐作品。
2. 多样化创作:Suno AI能够创作包含人声、旋律和歌词的完整歌曲,让用户自由探索和创作各种音乐风格和类型。
3. 灵活的定价策略:Suno AI提供免费版本,每天有一定免费额度,同时提供多种订阅选项,满足不同用户的需求。
4. 版权保障:Suno AI确保生成的音乐作品具有原创性,避免版权侵权问题。
预注册流程:
用户可以通过Suno AI官方网站或相关平台进行预注册,提前锁定体验名额。预注册后,用户将能够在Android设备上直接使用Suno AI,享受随时随地创作音乐的乐趣。
Suno AI的Android版开放预注册,不仅为移动设备用户提供了新的音乐创作工具,也为AI音乐创作领域带来了新的发展机遇。随着移动设备的普及和AI技术的进步,Suno AI有望成为音乐爱好者和创作者的新宠,让音乐创作变得更加便捷和普及。
Suno工具地址: https://www.aitop100.cn/tools/detail/1886.html
王慧文重返美团,领军AI“小队长”探索智能应用新领域
来源:36氪
近日,据36氪从多个独立信源处独家获悉,美团联合创始人、光年之外创始人王慧文已经回归美团,担任AI团队“小队长”,带队探索AI应用的新边界。王慧文所在的美团AI团队被称为GN06,该团队的主要业务方向包括情感陪伴、聊天机器人等,为候选人提供“没有边界的AI尝试机会”。
GN06团队由王慧文直管,并不归属美团任何一个事业群,其在美团中的状态相对独立,专注于探索主营业务之外的方向。GN06与美团已有的大模型团队、各业务条线中的AI团队也是相互独立的。GN06的主要产品之一,是在2023年11月上线的AI情感陪伴产品Wow,这是美团在AI应用赛道的第一个独立产品,用户可以自由定制角色形象、性格和音色,在AI社区中进行互动。
从今年夏天以来,GN06的招聘需求明显有迅速增加,Wow将重点放在了出海,并押注在北美市场。目前GN06的职位范围覆盖前端、客户端、后端、产品、运营、商分等等,不少岗位都要求有海外AI产品的认知和工作背景。
王慧文的回归,不仅是个人职业生涯的重要转折,也为美团在AI领域的深入探索和创新注入了新的活力。作为美团AI“小队长”,王慧文的领导和经验将对美团在AI技术应用方面的发展产生重要影响,值得期待美团在AI领域带来更多创新成果。
香港科技大学与中国科学技术大学联合打造AI驱动的开放世界游戏生成器
来源:百度
近日,由香港科技大学和中国科学技术大学等机构合作开发的AI实时游戏生成技术——GameGen-X,在全球范围内引发了广泛关注。这项技术基于先进的扩散Transformer模型,能够实时生成开放世界游戏内容,并实现玩家与游戏环境的深度交互控制。
GameGen-X的推出不仅标志着AI在游戏领域的应用达到了新的高度,也预示着一场游戏产业的革命即将来临。继AI游戏模型Oasis之后,GameGen-X为游戏开发者和玩家带来了前所未有的体验。这项技术能够模拟游戏引擎特性,实现高质量开放世界游戏生成,包括创建新角色、动态环境、复杂动作和各种事件等等。它还能进行交互式控制,根据当前片段预测或更改未来内容,实现游戏模拟。
对于传统游戏行业而言,GameGen-X的出现无疑是一次颠覆性的挑战。传统的游戏开发过程中,开放世界的构建通常需要大量的时间和人力,而GameGen-X则能够在玩家进入游戏的瞬间,实时生成丰富的游戏环境。这一技术的应用不仅大大缩短了游戏开发周期,还为玩家提供了无限的探索空间。
此外,GameGen-X还实现了玩家与游戏环境的深度交互控制。通过先进的AI算法,GameGen-X能够实时分析玩家的行为和意图,并据此调整游戏世界的状态。例如,当玩家在一个开放世界中探索时,GameGen-X可以根据玩家的移动路径和探索模式,动态生成新的任务和事件。
这种交互控制机制不仅提高了游戏的互动性和趣味性,还使得游戏世界更加生动和真实。玩家的每一个选择和行动都会对游戏世界产生影响,这种高度的互动性为玩家带来了前所未有的游戏体验。
随着GameGen-X等AI技术在游戏开发中的应用,我们有理由相信,未来游戏行业将更加注重创意和个性化体验,而AI技术将成为推动这一变革的核心力量。传统游戏行业正面临着前所未有的挑战,但同时也迎来了转型升级的机遇。
原文地址: https://www.aitop100.cn/infomation/details.html?id=19419