Suno收购WavTool:AI音乐圈大动作背后藏着啥盘算?
最近AI音乐圈有个大新闻:Suno把WavTool收入麾下了。这WavTool可是个厉害的网页版AI音频工作站,能拆分音频、生成音乐,还有智能助手帮忙做歌。Suno这波操作明显是想强化自己的音乐编辑能力,据说要把WavTool的功能和自家新出的编辑界面整到一块儿。
不过这收购时机有点微妙——Suno最近正忙着打官司呢。乡村音乐人告他们训练AI时用了受版权保护的录音,去年环球、华纳这些大公司也告过类似的事儿。现在几家音乐巨头正跟Suno谈版权许可的事儿。这时候宣布收购,有人说可能是想转移大家的注意力:你看我还在搞发展呢,别光盯着官司。
话说回来,Suno今年5月刚拿到1.25亿美元融资,不差钱。就是收购细节没公开,只知道WavTool大部分员工都加入了Suno团队,剩下的人没说。对了,WavTool这个网页工具预计11月就下线了,想体验的得抓紧。
腾讯甩出王炸,开源了混元-A13B模型:130亿参数大模型,中低端显卡也能玩!
腾讯最近放大招了,开源了腾讯混元-A13B模型,听着专业,说白了就是个超厉害的AI大脑。这模型总共有800亿参数,但实际干活的“活跃参数”是130亿,既能保持顶尖性能,又不怎么吃硬件——就算你用中低端显卡,一张卡也能跑起来,个人开发者和小公司用着特划算。
性能咋样呢?数学题、科学推理都难不倒它,做数学题还能一步步给你讲清楚思路。另外它还能调用工具,比如帮你写个旅游攻略、分析个数据文件,给开发智能体应用的人帮了大忙。技术上,腾讯用了20万亿高质量语料库训练它,还优化了“专家混合”架构,让模型更聪明。
最贴心的是它有两种模式:“快思考”直接给简洁答案,“慢思考”能深入分析。腾讯还顺便开源了两个新数据集,一个测代码能力,一个测智能体场景,明显是想带着大家一起把AI生态搞起来。以后腾讯还会出更多不同规格的模型,看来是要在开源这块下狠功夫了。
体验地址:【腾讯混元官网】
可灵AI玩出新花样:视频音效同步生成,沉浸式体验拉满!
看视频时声音和画面不搭是不是很闹心?可灵AI最近解决了这事儿——他们全系列视频模型都上线了“视频音效”功能,生成视频的时候能同步配好立体声音效,真正做到“所见即所听”。
要是你有现成的视频,也能上传到可灵,用新出的“视频生音效”模块一键匹配。这里面的技术叫Kling-Foley,能把音效和画面按帧对齐,比如画面里汽车鸣笛,音效马上就跟上,严丝合缝。而且这功能现在限时免费,不管新老用户都能体验,想玩的赶紧去试试。
可灵ai这波更新说白了就是让视频更“活”,以前做视频得自己找音效,现在AI直接搞定,省了不少事儿。尤其对短视频创作者来说,不用再为配音乐费劲儿了,效率直接拉满。
《太空杀》搞事情:阿里腾讯字节的AI都来参战了!
巨人网络的《太空杀》最近整了个大活——上线了“残局对决”模式,还拉来了阿里通义千问、腾讯混元、字节豆包三大国产AI模型一起玩。这模式可不是简单的人机对战,而是“真人+AI智能体+真人”的三方混战,算是游戏圈里头一个这么玩的。
每局游戏有2个真人,分别当“内鬼”和“船员”,然后随机加入一个大模型驱动的AI玩家团队。这些AI可不是傻呆呆的陪玩,它们会推理、能互动,还会看局势结盟投票,成了影响胜负的“第三势力”。真人得想办法忽悠AI站自己这边,不然分分钟被反杀。
游戏里还加了个数据模块,实时显示各个模型的胜率、发言次数这些数据,相当于开了个AI竞技直播。这波操作既让玩家体验到新玩法,又给AI技术做了科普,不得不说巨人网络这手挺聪明。
OpenAI扔出新模型:做研究查资料,这AI比你还溜!
OpenAI前两天发布了俩新模型:o3和o4-mini,专门用来做深度研究。啥意思呢?就是你能用它们自动搜网页、分析数据、执行代码,搞金融分析、科学研究啥的特方便。
o3是性能最强的,适合复杂任务,o4-mini则更便宜高效,适合处理大量查询。调用价格也不一样,o3每次10到40美元,o4-mini更便宜,2到8美元。跟ChatGPT里的研究功能不同,这个API版不用来回问问题,直接给它清晰指令,就能生成带引用的结构化报告,做市场分析、学术研究特别省事儿。
不过现在这API只能在ChatGPT生态里用,OpenAI说怕它生成误导性信息,先测试着。眼下谷歌、DeepSeek这些公司也在搞类似工具,开源社区也没闲着,看来AI研究工具这块儿以后得卷起来了。
一句话捏出你要的声音!ElevenLabs的Voice Design v3太懂创意人了
ElevenLabs新出的Voice Design v3简直是语音生成界的“变形金刚”——你只要说句话,比如“来个外太空搞笑外星人的声音,滑稽又高亢,带点咯咯笑”,它就能精准生成你想要的语音。支持70多种语言,几百种地方口音,什么美式、英式、日语、中文都不在话下,连苏格兰口音、巴西葡萄牙语都能模仿。
除了“一句话生成”,它还能精细调整语音细节:语气、语速、语调,甚至年龄感和性别特征都能改。比如你想要个沉稳的旁白,或者活泼的卡通音,调调参数就搞定。它还跟ElevenLabs最新的Eleven v3模型联动,能用[excited]这样的标签控制情感,比如在语音里加个“兴奋”的感觉。
生成的语音保真度也贼高,跟专业录音室录的差不多,但成本低多了。不管是做有声书、播客,还是给游戏角色配音,都能用。现在这工具已经开放了,API也快上线了,开发者以后能把它集成到各种应用里,想想就觉得方便。
1999元起!小米AI眼镜能拍能听还能扫码,全能王实锤了
小米最近出了款AI眼镜,简直是把“全能”写在了脑门上。先说价格,1999元起,比同类产品亲民不少。重量才40克,戴着不压鼻梁,还根据亚洲人脸型优化过,舒服。镜片有电致变色的,能调亮度,双指滑一下就能变颜色,时尚感拉满。
功能上,它自带1200万像素摄像头,能拍2K视频,还能直播,防抖效果不错,拍10分钟都稳当。内置小爱同学,能识物体、翻译、记会议,还能扫码支付(不过支付功能9月底更新后才有)。作为耳机,它是开放式的,听歌打电话不耽误听周围动静,续航8.6小时,比Ray-Ban的眼镜长一倍,充电45分钟就满。
跟小米生态链也打通了,能控制智能家居。现在只在中国卖,想买的得抓紧。这波操作明显是冲着智能穿戴市场来的,性价比这么高,估计能抢不少风头。
爆款视频一键生成!这AI工具让剪辑师都慌了
HeyGen新出的AI视频Agent简直是内容创作者的“救命神器”。以前做视频得写脚本、选镜头,麻烦得很,现在你只要上传点图片、视频片段或者文字,AI就能自己搞定:先规划故事,再写脚本,最后选合适的镜头拼成成片,几分钟就能出一个专业级视频,直接能发抖音、做广告。
不管你是营销团队、短视频博主,还是中小企业,都能用它快速产出内容。AI还能根据素材分析品牌调性,保证视频风格跟你想要的一致。操作也简单,没学过剪辑的人也能上手,界面直观,跟着提示走就行。
这事儿说白了就是让视频创作门槛大降,以前得专业团队干的活儿,现在AI一个人就包圆了。以后估计会有更多人用这工具做内容,说不定还能催生出新的创作模式。HeyGen这步棋走得挺准,抓住了内容行业的痛点。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: