ElevenLabs新平台上线:图像视频音乐一体,创作者无需多平台切换
对于经常做视频的创作者和营销人员来说,来回切换多个工具剪辑、配音、加音效简直是常态,既耗时又容易出错。近期,多模态AI领域的头部品牌ElevenLabs推出了全新的Image & Video平台,直接解决了这个痛点。
这个新平台把图像生成、视频制作、声音合成、音乐创作和音效设计整合到一起,形成了从创意到成品的完整闭环。用户先在平台内生成需要的画面和动态视频,接着就能直接添加专业旁白、背景音乐和环境音效,整个流程不用切换任何软件,衔接特别顺畅。
平台还集合了全球多款顶级模型,像能做超长一致性视频的Google Veo、电影级画质的OpenAI Sora,还有擅长超现实物理动效的Kling,再加上ElevenLabs自家的自然语音和音乐生成模型,混搭使用效果远超单一工具。
针对商业需求,平台支持竖屏、横屏等多种比例,能适配主流短视频和视频平台,内置的语音与音乐库可直接用于商业广告投放,还能一键切换多语种旁白。
根据官方演示,只要输入30秒文案,就能完成从故事板生成到4K成品导出的全流程,最快5分钟就能搞定一条可投放的营销视频,大大提升了内容生产效率。
工具地址:ElevenLabs网页版官网
国产AI模型Kimi K2接入Perplexity,与GPT - 5.1同批上线
国产AI模型又迎来了重要突破,月之暗面(Moonshot AI)推出的Kimi K2 Thinking模型成功接入了全球知名的AI搜索应用Perplexity,成为该平台唯一接入的国产模型,而且和OpenAI刚发布的GPT - 5.1属于同批接入,这也证明了国产AI技术在国际上的竞争力。
成立于2022年的Perplexity发展速度很快,凭借独特的对话式“答案引擎”,能提供带引用来源的最新网络信息,目前月活跃用户已经超过3000万,年度经常性收入接近2亿美元,估值更是突破200亿美元,是全球估值最高的AI搜索应用之一。
这次接入的Kimi K2是一款开源混合专家大模型,总参数达到1万亿,激活参数为320亿,还基于MuonClip优化器做了升级优化。除了Perplexity,Kimi K2系列模型已经被Cherry Studio、Cline等多个AI应用接入,能适配不同场景的使用需求,展现出了很强的实用性和性能优势。
此次合作不仅让Kimi K2的市场竞争力得到提升,也给用户提供了更多高效获取信息的方式,推动国产AI技术在国际市场上进一步发展,未来有望覆盖更多应用场景。
工具地址:Perplexity网页版官网入口 (海外网站需要科学上网)

昆仑万维Skywork R1V4 - Lite上线:拍张照就能解决问题的轻量AI智能体
很多人用AI工具时都怕复杂的提示词,昆仑万维近期推出的轻量级多模态智能体Skywork R1V4 - Lite,正好解决了这个难题,不用复杂操作,拍张照片就能获得解决方案。
这款智能体和传统模型不一样,不仅能深度推理,还能主动进行图像操作、调用外部工具,实现多模态深度研究,在复杂场景中使用也很灵活。用户遇到需要处理的信息,只需拍摄一张照片,它就能自动判断空间位置、放大模糊文字,还能绘制辅助线,让信息变得清晰易懂。
在权威基准测试中,Skywork R1V4 - Lite表现亮眼,尤其是在多模态理解任务上超过了Gemini2.5Flash。面对信息不足或视角受限的情况,它能自动裁剪、放大和旋转图像,形成可回溯的“视觉行动链”,帮用户理清思路。
同时,它还支持联网搜索,在执行任务时能触发深度研究,通过和外部资源交互,让推理更有深度和广度。不管是学术研究、法律事务,还是生态保护、电商运营等领域,都能发挥作用。更实用的是它的主动式任务规划能力,能基于视觉输入生成详细的行动计划,让用户不仅能得到答案,还知道该怎么执行。
详情查看:昆仑万维Skywork R1V4-Lite正式上线,拍照即用,多模态AI新体验!

Poe AI群聊功能上线:200人可协作,支持多AI模型混搭使用
平时团队协作brainstorm或规划活动时,经常需要切换不同AI工具找灵感、做分析,现在Poe平台新推出的群聊功能,让这些操作都能在一个聊天室里完成。
这款群聊功能最高支持200人同时在线,用户可以邀请同事、朋友一起加入,还能自由调用平台内的AI模型参与互动,打破了传统AI聊天只能单人使用的局限。平台兼容的AI模型超过200种,涵盖文本、图像、视频、音频等多种类型,还支持自定义bot接入,满足不同场景的需求。
在群聊中,用户可以根据需求混搭调用顶级模型,比如用GPT - 5.1做深度文本生成,Claude4.5负责逻辑推理,Gemini2.5处理多语言内容,Sora2创作视觉素材,Veo3.1优化视频动态效果,就像组建了一支“AI军团”,让协作效率翻倍。
考虑到现在很多人需要移动办公,群聊功能还实现了桌面端和移动端的跨设备实时同步,不管是在办公室还是外出,聊天记录和AI响应都能即时更新,不会因为切换设备中断协作。不管是旅行规划、项目头脑风暴,还是组织问答游戏,这个群聊功能都能适配,让高端AI资源变得更易获取,助力团队和个人释放创意。
工具地址:Poe AI网页版官网 (海外网站需要科学上网)
蚂蚁集团灵光App正式发布:30秒生成小应用,支持多模态交互
11月18日,蚂蚁集团推出了全模态通用AI助手“灵光”,这款App最吸引人的地方就是能通过自然语言,在30秒内生成可编辑、可交互、可分享的小应用,而且已经同步登陆安卓和苹果应用商店。
灵光App首批上线了三大核心功能:
- 灵光对话:打破了传统文字问答的模式,不会堆砌文字,而是通过结构化思维让回答逻辑清晰,还能生成动态3D模型、可交互地图、音视频等可视化内容,让复杂知识变得容易理解。比如学生咨询知识点,它能提炼重点,用3D动图、互动表格等形式展示,帮助快速掌握。
- 灵光闪应用:是专门为普通用户设计的功能,不管是想要健身计划工具、旅行规划器,还是健康食谱生成器,只要输入一句话,最快30秒就能生成对应的应用。用户还能根据自己的需求自定义参数,生成后可以直接使用,也能分享给他人。比如想知道溏心蛋怎么煮,它会生成溏心蛋时间计算器,支持根据鸡蛋大小、想要的熟度调整参数;想了解养车成本,就能生成养车成本计算器,自由设置里程、油费等条件。
- 灵光开眼:搭载了AGI相机技术,能通过实时视频流解析理解物理世界,支持文生图、图生图等创作模式,旅游时对准建筑就能获得实时讲解,实用性很强。

Google AI旅行工具Flight Deals扩容:覆盖200国比价,一键生成旅行攻略
经常出国旅行的人,找机票、做行程攻略往往要花费大量时间,现在Google的AI旅行工具套件完成扩容,让这些操作变得简单高效。
此次更新后,Flight Deals功能从原来的美加印地区扩展到200多个国家与地区,支持60种语言比价,不管去哪个国家,都能轻松找到低价航线。桌面端的AI Mode还新增了Canvas侧边栏,能实时聚合航班、酒店、地图评价等信息,一键生成行程草稿,特别方便。
使用流程也很简单,用户在Google Search或Google Flights中输入自然语言需求,比如“下周去巴黎的低价机票”,Flight Deals就会立刻返回相关结果;点击“Create with Canvas”,就能得到包含航班、酒店、餐厅和活动安排的完整行程。如果对行程有调整需求,比如“想住得离早午餐店近一些”,AI会即时权衡,给出排序后的建议。
另外,代理预订能力已经向美国全量用户开放,目前已经打通OpenTable、Resy等平台,用户只需描述用餐人数、时间和口味偏好,就能收到可订位的餐厅列表,一键完成预约。机票和酒店直订功能正在内测,后续会支持比价、查看时刻表、房型照片和评价,最终能在搜索页完成支付,而且所有功能都没有额外手续费,沿用现有广告与佣金模式。
详情查看:Google AI旅行工具大升级全球覆盖、一键规划,旅行从此更轻松!

xAI Grok 4.1版本发布:质量速度双提升,可免费使用
埃隆·马斯克创办的xAI公司近期推出了Grok模型的升级版本Grok 4.1,此次更新带来了Grok 4.1和Grok 4.1Thinking两款新模型,而且都能免费使用,付费用户则享有更少的使用限制。
这次升级最明显的提升就是“幻觉”现象大幅减少,相较于之前的版本,发生概率降低了三倍,这让Grok 4.1成为xAI目前发布的表现最佳的版本之一。虽然目前还不清楚它和OpenAI最新发布的GPT - 5.1在性能上的具体差距,但从初步测试数据来看,表现相当不错。
根据LMArena的Text Arena工具测试结果,Grok 4.1(Thinking)在各项竞争测试中以1510的得分排名第一,Grok 4.1则以1437的得分位列第19名。和两个月前推出的Grok 4Fast相比,这个版本的得分提升了40多分,能看出在质量和速度上都做了优化。
不过需要注意的是,Grok 4.1可能不是今年最强的AI模型,谷歌正在准备推出Gemini 3.0,外界预计这款模型的功能会更强大。对于普通用户来说,免费可用且性能提升明显的Grok 4.1已经能满足日常使用需求,不管是查询信息、生成内容还是逻辑推理,都能提供稳定的支持。
工具地址:Grok AI网页版官网(海外网站需要科学上网)

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









