ChatGPT放大招!Mac版录音功能上线,打工人会议效率瞬间起飞!
还在为会议记录发愁吗?OpenAI刚刚给ChatGPT Plus用户送上一份大礼!从现在起,Mac用户只需轻轻一点,就能让ChatGPT变身超级会议助手。
这个新上线的录音模式,操作超简单。在Mac版ChatGPT应用的聊天窗口底部,你会看到一个小小的“录音”按钮,点击它,ChatGPT就开始工作啦!它能同时捕捉麦克风和系统音频,不管是在线会议,还是头脑风暴时的灵光一闪,都能精准记录,一次最长能录 120 分钟呢。
录音结束后,音频会自动上传到OpenAI服务器,很快,一份详细的转录文本就会出现在你眼前,里面不仅有完整对话,还贴心地总结了关键点、列出了行动项,就像有个私人秘书在帮你整理会议内容。
而且,OpenAI也很重视隐私,原始音频在转录完成后就会被删除,不会用于模型训练。不过,要是你开启了“为所有人改进模型”,转录文本和相关画布可能会被审核用于训练哦。要是你不想这样,关掉这个选项就行。另外,团队、企业和教育工作区的管理员还能在设置里直接关闭录音功能,安全又放心。
目前,这个超赞的功能只在Mac版ChatGPT应用中对Plus用户开放,Windows、Android以及网页版的小伙伴们可能还得再等等。但不管怎样,这一功能的上线,已经让不少打工人看到了提升效率的希望,以后开会再也不用手忙脚乱记笔记了,把更多精力放在讨论上,会后直接收获一份完整纪要,简直不要太爽!
体验地址:ChatGPT网页版官网入口
免费又强大!LTX-Video 13B开源来袭,30倍速高清视频轻松生成!
视频创作爱好者们的福音来了!Lightricks旗下的LTX Studio发布了全新的开源视频生成模型LTX-Video 13B,它就像一把神奇的钥匙,为你打开创意无限的视频创作大门。
LTX-Video 13B到底强在哪?
- 多尺度渲染技术:以往的视频生成模型,生成速度和画质很难兼得,而它另辟蹊径,先以低分辨率快速搭建出视频的大致运动和场景框架,就像搭房子先立起骨架,然后再逐步填充细节,把房子装修得漂漂亮亮。这一创新,让它的生成速度比同类模型快了整整 30 倍,渲染一段 5 秒的视频,别人还在苦苦等待,它 2 秒就搞定了,而且在普通的NVIDIA RTX 4090消费级GPU上就能流畅运行,内存占用还低,简直是为咱普通创作者量身定制。
- 功能强大:在功能方面,它更是强大到超乎想象。动作连贯性、场景结构把握得精准到位,生成的视频逻辑清晰、细节满满。你想让视频里的角色怎么动,镜头怎么切换,都能通过文本提示或者参考图像轻松实现,就像在指挥一场专属的电影拍摄。不仅如此,它还支持视频延展,能把现有的视频延长到60秒,要是觉得风格不够独特,还能一键替换风格,把现实场景变成动画世界,短视频制作、广告创意设计、社交媒体内容创作,有了它,都变得易如反掌。
最让人惊喜的是,它是开源的!在GitHub和Hugging Face上就能免费获取,开发者和创作者可以根据自己的需求自由修改、定制。Lightricks还贴心地提供了LTX-Video Trainer工具,不管是完整微调,还是用LoRA训练,都不在话下,轻松打造属于自己的个性化控制模型。为了让更多人能用上,还推出了8位量化版本和IC-LoRA Detailer,在低内存设备上也能顺畅运行。
有了LTX-Video 13B,视频创作不再是难题,赶紧去体验一下,说不定下一个爆款视频就出自你手!
体验地址:LTX Studio网页版入口
模型下载地址: https://ltxv.video/#get-started
腾讯元宝牵手QQ音乐,听歌新姿势,一句话、一划就播放!
音乐爱好者们注意啦!腾讯元宝又有新玩法,和QQ音乐强强联手,给大家带来了超便捷的听歌体验。只要把元宝App升级到2.30 版本以上,再打开联网模式,就能解锁新功能。
现在,在元宝里,你可以像和朋友聊天一样,随意提起歌名或者歌词,系统就像有了“顺风耳”,瞬间识别出来,还会贴心地把相关歌曲用线划出来,你只需要轻轻一点,就能直接跳转到QQ音乐播放,是不是超级方便?以前找歌,得打开音乐App,在搜索框里敲半天字,现在有了元宝,一句话的事儿,听歌变得轻松又有趣。
这个功能可不只是简单的搜歌,它让腾讯元宝在智能问答的基础上,多了音乐这个酷炫的“技能”,进一步拓展了多模态应用能力。对咱们普通用户来说,就是多了一个超轻量化的听歌入口,随时随地,想听就听。无论是做家务时想听点欢快的歌曲提提神,还是睡前想找首轻柔的音乐助眠,都不用再切换好几个App,在元宝里就能一步到位。
腾讯这波操作,把AI和音乐内容生态巧妙融合,让智能助手在娱乐领域更接地气,也让我们的生活因为科技变得更加便捷,以后听歌,就用腾讯元宝试试吧,说不定会给你带来更多惊喜!
体验地址:腾讯元宝网页版官网入口
Mistral AI搞事情!Le Chat聊天机器人升级,企业和个人研究神器诞生!
法国人工智能实验室Mistral最近给自家的聊天机器 Le Chat来了个大变身,新功能一个接一个,直接向行业大佬们发起挑战。
- “深度研究”模式:简直就是一个随身的超级研究员。不管你是个人用户,计划一场说走就走的旅行,想全方位了解目的地的吃喝玩乐;还是企业用户,要深入研究市场、分析数据,它都能帮上大忙。它能在网上海量的信息里精准“淘金”,快速、准确地回答你的各种问题。比如说,你想了解某个行业的最新趋势,它能迅速整合多方资料,给出一份详细又专业的分析报告。
- 数据安全保障:和其他云平台不同,Mistral 特别懂企业的担忧,知道很多企业,尤其是银行、国防、政府这些对数据安全要求极高的行业,不敢轻易把数据上传到云端。所以,Le Chat可以直接和企业内部数据连接,让企业在自己的安全环境里,利用强大的深度推理能力分析数据,完全不用担心信息泄露。
- 多语言推理能力提升:Le Chat的多语言推理能力也大大提升,法语、西班牙语、日语等多种语言都不在话下,而且还能在同一句话里轻松切换语言,就像和精通多国语言的翻译官聊天一样。
- “项目”功能:新推出的“项目”功能,能帮你把和项目相关的聊天记录、文档、想法都整理到一个专门的空间里,项目管理变得井井有条,再也不用担心资料乱成一团找不到了。
- 图像编辑功能:更绝的是图像编辑功能,现在你不用再学复杂的图像处理软件,只要跟Le Chat说“去掉这个物体”“把我放到另一个城市”,它就能按照你的要求,轻松创建、编辑图像。
有了这些新功能,Le Chat不再只是一个简单的聊天工具,而是成为了一个功能全面、强大实用的助手,不管是工作还是生活,都能给你带来超多便利,赶紧去体验一下吧!
体验地址:Mistral AI网页版官网入口
百度小度放大招!MCP Server 上线,开启万物智能互联新时代!
你能想象,以后只要动动嘴,家里的各种智能设备就能听你指挥,还能根据你的需求自动联动吗?百度小度做到了!7月18日,小度全面上线首个支持与物理世界交互的MCP Server,这可是个大突破,直接把智能生活提升到了一个新高度。
这次小度开放平台推出了两个超厉害的核心服务:
- 小度音箱 MCP Server:开发者通过简单的文本指令,就能控制设备、让音箱语音播报,甚至还能远程看护。
- 小度 IoT MCP Server:它把全屋设备控制、状态查询和场景联动这些复杂功能都整合在一起,而且开发者不用费太多事,简单配置一下,就能用自然语言操控 1800 多家生态厂商的智能设备,以前复杂的智能设备开发,现在变得轻松多了。
小度在智能领域可是根基深厚,智能音箱、智能屏、闺蜜机、学习机、健身镜等全场景智能终端产品,一应俱全。线下还有400多家门店,和美的、格力、海尔、创维等 1800 多家智能家居生态厂商紧密合作,打造了超200万间智能酒店客房。有了这么强大的产业基础,小度 MCP Server 一推出,就展现出巨大优势。
对于开发者来说,基于小度开放的 MCP Server,只要配置好基础 API 密钥,就能快速调用服务能力,就算不是专业开发人员,也能轻松创建个性化智能应用。比如说,家长可以做一个“学习鼓励师”应用,随时关注孩子学习状态;用户说一句“营造浪漫观影氛围”,家里灯光自动调暗、空调温度调好、窗帘关闭;还能开发能耗管理应用,用 AI 优化设备运行,节省电费。
小度MCP Server就像是一把万能钥匙,打开了连接物理世界的大门,让“全民智能开发”不再是梦。未来,小度还会继续把MCP协议和生成式 AI 深度融合,让智能家居从简单的单点控制,进化成主动服务,我们的生活也会因为它变得更加智能、便捷!
体验地址:小度MCP Server网页版官网入口
Aider Leaderboard榜单出炉!Kimi K2编程实力惊艳,性价比超高!
程序员们看过来!Aider Leaderboard 公布的最新测试结果里,Moonshot AI推出的开源模型Kimi K2表现亮眼,在编程领域大放异彩。
Aider Leaderboard 可是评估大语言模型代码编辑能力的权威“裁判”,各种多语言编程任务、复杂代码编辑场景,它都能公平公正地进行测试。这次测试中,Kimi K2凭借出色的工具调用和代码执行能力,取得了和 Qwen3 - 235B - A22B 相当的成绩,在开源模型里名列前茅。虽然和 o3 - mini - high、Claude - 3.7 - Sonnet 比起来,还有一点点差距,但在推理成本上,Kimi K2 优势巨大,性价比超高。
Kimi K2 采用了混合专家架构,别看它总参数量达 1 万亿,单次推理激活参数只有 320 亿,上下文长度还能支持 128k,这样的设计让它在处理复杂编程任务时游刃有余,尤其是需要精确代码替换、多步骤任务的场景,表现更是出色。
而且,Kimi K2 的推理成本低得惊人,只有 0.14 美元/百万输入 token 和 2.49 美元/百万输出 token,差不多是 Claude - 4 - Sonnet 的三分之一,这对开发者来说太友好了,花更少的钱,办更多的事,用它构建终端编码 Agent 再合适不过。搭配上 Claude Code 环境,代码编辑、文件操作、shell 命令这些操作,它都能高效完成,就像给 Linux 终端装了一个聪明的“大脑”。
在实际测试中,Kimi K2 在 SWE - bench Verified 测试里,单次尝试准确率达到 65.8%,超过了 GPT - 4.1 的 54.6%,仅次于 Claude - 4 - Sonnet。在 LiveCodeBench 和 EvalPlus 基准测试里,也分别取得 53.7%和 80.3%的好成绩,在开源模型里独占鳌头。它在网页生成方面也表现突出,甚至在一些任务上超过了 Claude - 4 - Sonnet。
Kimi K2 支持 vLLM 和 Hugging Face 等推理框架,开发者可以通过 Moonshot AI 的 API 或者 Hugging Face 上的模型权重轻松部署,使用门槛大大降低。它开源的特性(MIT 协议)和对多种推理引擎的兼容性,也让更多开发者愿意尝试、使用它。有了 Kimi K2,中小开发团队也能拥有强大的智能编码工具,说不定会在编程领域掀起新的创新浪潮,赶紧去试试吧!
体验地址:Kimi K2网页版官网入口
Suno v4.5+ 版本更新:集成先进人声替换技术,实现原唱音轨替换。
喜欢玩音乐创作的小伙伴有福啦!Suno的AI音乐生成模型 v4.5+正式上线,这次更新带来了好多让人尖叫的新功能,音乐创作变得更有意思了。
- “Add Vocals”人声替换功能:最吸引人的就是“Add Vocals”人声替换功能。以前,要是想给一段伴奏加上自己的歌声,要么得有专业录音设备,要么得费好大劲去后期处理。现在有了这个功能,不管你是上传自己找来的伴奏音频,还是用Suno内置的乐器伴奏,只要输入歌词,它就能马上生成一首完整的歌曲,就像有个专业音乐团队在帮你制作一样。哪怕你没有专业录音条件,也能轻松把自己的音乐灵感变成实实在在的作品,把器乐曲变成带歌词的动听歌曲,或者给原创旋律配上完美人声,都不在话下。
- “Add Instrumentals”功能:还有“Add Instrumentals”功能,同样超厉害。你只要上传一段自己的歌声或者哼唱,Suno的AI引擎就像有魔法一样,能自动生成和你声音匹配的伴奏,快速做出高品质的音乐 demo。对于独立音乐人、内容创作者和音乐爱好者来说,这简直是个高效创作的利器,以前创作一首完整歌曲可能要花很长时间,现在分分钟就能搞定一个雏形。
- “Inspire”功能:另外,新上线的“Inspire”功能也很赞。它能让你从任何播放列表里获取灵感,快速生成新歌曲。它会分析播放列表里音乐的风格、情绪、元素,然后按照你的喜好,创作出符合你口味的音乐,不管是给短视频配乐、做播客背景音乐,还是设计游戏音效,都能轻松实现。
不过要注意,这些新功能目前只对Suno AI的 Pro 和 Premier 付费用户开放,免费用户也别灰心,还是可以用 v4.0 模型生成最多 20 首歌曲,或者用 v3.5 模型每天生成 10 首歌曲。而且,v4.5+在音质和创作体验上也有很大提升,音质更清晰、混音更平衡,提示增强助手还能帮你更好地控制音乐生成过程,歌曲时长也从 4 分钟延长到了 8 分钟,有更多空间创作复杂的音乐。有了Suno v4.5+,音乐创作的可能性变得无穷无尽,赶紧去试试,说不定你就是下一个音乐创作达人!
体验地址:Suno AI网页版官网入口
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: