每日AI资讯-2025年07月18日-AITOP100,AI资讯

ChatGPT放大招！Mac版录音功能上线，打工人会议效率瞬间起飞！

还在为会议记录发愁吗？OpenAI刚刚给ChatGPT Plus用户送上一份大礼！从现在起，Mac用户只需轻轻一点，就能让ChatGPT变身超级会议助手。

这个新上线的录音模式，操作超简单。在Mac版ChatGPT应用的聊天窗口底部，你会看到一个小小的“录音”按钮，点击它，ChatGPT就开始工作啦！它能同时捕捉麦克风和系统音频，不管是在线会议，还是头脑风暴时的灵光一闪，都能精准记录，一次最长能录 120 分钟呢。

录音结束后，音频会自动上传到OpenAI服务器，很快，一份详细的转录文本就会出现在你眼前，里面不仅有完整对话，还贴心地总结了关键点、列出了行动项，就像有个私人秘书在帮你整理会议内容。

而且，OpenAI也很重视隐私，原始音频在转录完成后就会被删除，不会用于模型训练。不过，要是你开启了“为所有人改进模型”，转录文本和相关画布可能会被审核用于训练哦。要是你不想这样，关掉这个选项就行。另外，团队、企业和教育工作区的管理员还能在设置里直接关闭录音功能，安全又放心。

目前，这个超赞的功能只在Mac版ChatGPT应用中对Plus用户开放，Windows、Android以及网页版的小伙伴们可能还得再等等。但不管怎样，这一功能的上线，已经让不少打工人看到了提升效率的希望，以后开会再也不用手忙脚乱记笔记了，把更多精力放在讨论上，会后直接收获一份完整纪要，简直不要太爽！

体验地址：ChatGPT网页版官网入口

ChatGPT

免费又强大！LTX-Video 13B开源来袭，30倍速高清视频轻松生成！

视频创作爱好者们的福音来了！Lightricks旗下的LTX Studio发布了全新的开源视频生成模型LTX-Video 13B，它就像一把神奇的钥匙，为你打开创意无限的视频创作大门。

LTX-Video 13B到底强在哪？

多尺度渲染技术：以往的视频生成模型，生成速度和画质很难兼得，而它另辟蹊径，先以低分辨率快速搭建出视频的大致运动和场景框架，就像搭房子先立起骨架，然后再逐步填充细节，把房子装修得漂漂亮亮。这一创新，让它的生成速度比同类模型快了整整 30 倍，渲染一段 5 秒的视频，别人还在苦苦等待，它 2 秒就搞定了，而且在普通的NVIDIA RTX 4090消费级GPU上就能流畅运行，内存占用还低，简直是为咱普通创作者量身定制。
功能强大：在功能方面，它更是强大到超乎想象。动作连贯性、场景结构把握得精准到位，生成的视频逻辑清晰、细节满满。你想让视频里的角色怎么动，镜头怎么切换，都能通过文本提示或者参考图像轻松实现，就像在指挥一场专属的电影拍摄。不仅如此，它还支持视频延展，能把现有的视频延长到60秒，要是觉得风格不够独特，还能一键替换风格，把现实场景变成动画世界，短视频制作、广告创意设计、社交媒体内容创作，有了它，都变得易如反掌。

最让人惊喜的是，它是开源的！在GitHub和Hugging Face上就能免费获取，开发者和创作者可以根据自己的需求自由修改、定制。Lightricks还贴心地提供了LTX-Video Trainer工具，不管是完整微调，还是用LoRA训练，都不在话下，轻松打造属于自己的个性化控制模型。为了让更多人能用上，还推出了8位量化版本和IC-LoRA Detailer，在低内存设备上也能顺畅运行。

有了LTX-Video 13B，视频创作不再是难题，赶紧去体验一下，说不定下一个爆款视频就出自你手！

体验地址：LTX Studio网页版入口

模型下载地址： https://ltxv.video/#get-started

腾讯元宝牵手QQ音乐，听歌新姿势，一句话、一划就播放！

音乐爱好者们注意啦！腾讯元宝又有新玩法，和QQ音乐强强联手，给大家带来了超便捷的听歌体验。只要把元宝App升级到2.30 版本以上，再打开联网模式，就能解锁新功能。

现在，在元宝里，你可以像和朋友聊天一样，随意提起歌名或者歌词，系统就像有了“顺风耳”，瞬间识别出来，还会贴心地把相关歌曲用线划出来，你只需要轻轻一点，就能直接跳转到QQ音乐播放，是不是超级方便？以前找歌，得打开音乐App，在搜索框里敲半天字，现在有了元宝，一句话的事儿，听歌变得轻松又有趣。

这个功能可不只是简单的搜歌，它让腾讯元宝在智能问答的基础上，多了音乐这个酷炫的“技能”，进一步拓展了多模态应用能力。对咱们普通用户来说，就是多了一个超轻量化的听歌入口，随时随地，想听就听。无论是做家务时想听点欢快的歌曲提提神，还是睡前想找首轻柔的音乐助眠，都不用再切换好几个App，在元宝里就能一步到位。

腾讯这波操作，把AI和音乐内容生态巧妙融合，让智能助手在娱乐领域更接地气，也让我们的生活因为科技变得更加便捷，以后听歌，就用腾讯元宝试试吧，说不定会给你带来更多惊喜！

体验地址：腾讯元宝网页版官网入口

腾讯元宝

Mistral AI搞事情！Le Chat聊天机器人升级，企业和个人研究神器诞生！

法国人工智能实验室Mistral最近给自家的聊天机器 Le Chat来了个大变身，新功能一个接一个，直接向行业大佬们发起挑战。

“深度研究”模式：简直就是一个随身的超级研究员。不管你是个人用户，计划一场说走就走的旅行，想全方位了解目的地的吃喝玩乐；还是企业用户，要深入研究市场、分析数据，它都能帮上大忙。它能在网上海量的信息里精准“淘金”，快速、准确地回答你的各种问题。比如说，你想了解某个行业的最新趋势，它能迅速整合多方资料，给出一份详细又专业的分析报告。
数据安全保障：和其他云平台不同，Mistral 特别懂企业的担忧，知道很多企业，尤其是银行、国防、政府这些对数据安全要求极高的行业，不敢轻易把数据上传到云端。所以，Le Chat可以直接和企业内部数据连接，让企业在自己的安全环境里，利用强大的深度推理能力分析数据，完全不用担心信息泄露。
多语言推理能力提升：Le Chat的多语言推理能力也大大提升，法语、西班牙语、日语等多种语言都不在话下，而且还能在同一句话里轻松切换语言，就像和精通多国语言的翻译官聊天一样。
“项目”功能：新推出的“项目”功能，能帮你把和项目相关的聊天记录、文档、想法都整理到一个专门的空间里，项目管理变得井井有条，再也不用担心资料乱成一团找不到了。
图像编辑功能：更绝的是图像编辑功能，现在你不用再学复杂的图像处理软件，只要跟Le Chat说“去掉这个物体”“把我放到另一个城市”，它就能按照你的要求，轻松创建、编辑图像。

有了这些新功能，Le Chat不再只是一个简单的聊天工具，而是成为了一个功能全面、强大实用的助手，不管是工作还是生活，都能给你带来超多便利，赶紧去体验一下吧！

体验地址：Mistral AI网页版官网入口

Mistral AI

百度小度放大招！MCP Server 上线，开启万物智能互联新时代！

你能想象，以后只要动动嘴，家里的各种智能设备就能听你指挥，还能根据你的需求自动联动吗？百度小度做到了！7月18日，小度全面上线首个支持与物理世界交互的MCP Server，这可是个大突破，直接把智能生活提升到了一个新高度。

这次小度开放平台推出了两个超厉害的核心服务：

小度音箱 MCP Server：开发者通过简单的文本指令，就能控制设备、让音箱语音播报，甚至还能远程看护。
小度 IoT MCP Server：它把全屋设备控制、状态查询和场景联动这些复杂功能都整合在一起，而且开发者不用费太多事，简单配置一下，就能用自然语言操控 1800 多家生态厂商的智能设备，以前复杂的智能设备开发，现在变得轻松多了。

小度在智能领域可是根基深厚，智能音箱、智能屏、闺蜜机、学习机、健身镜等全场景智能终端产品，一应俱全。线下还有400多家门店，和美的、格力、海尔、创维等 1800 多家智能家居生态厂商紧密合作，打造了超200万间智能酒店客房。有了这么强大的产业基础，小度 MCP Server 一推出，就展现出巨大优势。

对于开发者来说，基于小度开放的 MCP Server，只要配置好基础 API 密钥，就能快速调用服务能力，就算不是专业开发人员，也能轻松创建个性化智能应用。比如说，家长可以做一个“学习鼓励师”应用，随时关注孩子学习状态；用户说一句“营造浪漫观影氛围”，家里灯光自动调暗、空调温度调好、窗帘关闭；还能开发能耗管理应用，用 AI 优化设备运行，节省电费。

小度MCP Server就像是一把万能钥匙，打开了连接物理世界的大门，让“全民智能开发”不再是梦。未来，小度还会继续把MCP协议和生成式 AI 深度融合，让智能家居从简单的单点控制，进化成主动服务，我们的生活也会因为它变得更加智能、便捷！

体验地址：小度MCP Server网页版官网入口

小度MCP Server

Aider Leaderboard榜单出炉！Kimi K2编程实力惊艳，性价比超高！

程序员们看过来！Aider Leaderboard 公布的最新测试结果里，Moonshot AI推出的开源模型Kimi K2表现亮眼，在编程领域大放异彩。

Aider Leaderboard 可是评估大语言模型代码编辑能力的权威“裁判”，各种多语言编程任务、复杂代码编辑场景，它都能公平公正地进行测试。这次测试中，Kimi K2凭借出色的工具调用和代码执行能力，取得了和 Qwen3 - 235B - A22B 相当的成绩，在开源模型里名列前茅。虽然和 o3 - mini - high、Claude - 3.7 - Sonnet 比起来，还有一点点差距，但在推理成本上，Kimi K2 优势巨大，性价比超高。

Kimi K2 采用了混合专家架构，别看它总参数量达 1 万亿，单次推理激活参数只有 320 亿，上下文长度还能支持 128k，这样的设计让它在处理复杂编程任务时游刃有余，尤其是需要精确代码替换、多步骤任务的场景，表现更是出色。

而且，Kimi K2 的推理成本低得惊人，只有 0.14 美元/百万输入 token 和 2.49 美元/百万输出 token，差不多是 Claude - 4 - Sonnet 的三分之一，这对开发者来说太友好了，花更少的钱，办更多的事，用它构建终端编码 Agent 再合适不过。搭配上 Claude Code 环境，代码编辑、文件操作、shell 命令这些操作，它都能高效完成，就像给 Linux 终端装了一个聪明的“大脑”。

在实际测试中，Kimi K2 在 SWE - bench Verified 测试里，单次尝试准确率达到 65.8%，超过了 GPT - 4.1 的 54.6%，仅次于 Claude - 4 - Sonnet。在 LiveCodeBench 和 EvalPlus 基准测试里，也分别取得 53.7%和 80.3%的好成绩，在开源模型里独占鳌头。它在网页生成方面也表现突出，甚至在一些任务上超过了 Claude - 4 - Sonnet。

Kimi K2 支持 vLLM 和 Hugging Face 等推理框架，开发者可以通过 Moonshot AI 的 API 或者 Hugging Face 上的模型权重轻松部署，使用门槛大大降低。它开源的特性（MIT 协议）和对多种推理引擎的兼容性，也让更多开发者愿意尝试、使用它。有了 Kimi K2，中小开发团队也能拥有强大的智能编码工具，说不定会在编程领域掀起新的创新浪潮，赶紧去试试吧！

体验地址：Kimi K2网页版官网入口

Kimi K2

Suno v4.5+ 版本更新：集成先进人声替换技术，实现原唱音轨替换。

喜欢玩音乐创作的小伙伴有福啦！Suno的AI音乐生成模型 v4.5+正式上线，这次更新带来了好多让人尖叫的新功能，音乐创作变得更有意思了。

“Add Vocals”人声替换功能：最吸引人的就是“Add Vocals”人声替换功能。以前，要是想给一段伴奏加上自己的歌声，要么得有专业录音设备，要么得费好大劲去后期处理。现在有了这个功能，不管你是上传自己找来的伴奏音频，还是用Suno内置的乐器伴奏，只要输入歌词，它就能马上生成一首完整的歌曲，就像有个专业音乐团队在帮你制作一样。哪怕你没有专业录音条件，也能轻松把自己的音乐灵感变成实实在在的作品，把器乐曲变成带歌词的动听歌曲，或者给原创旋律配上完美人声，都不在话下。
“Add Instrumentals”功能：还有“Add Instrumentals”功能，同样超厉害。你只要上传一段自己的歌声或者哼唱，Suno的AI引擎就像有魔法一样，能自动生成和你声音匹配的伴奏，快速做出高品质的音乐 demo。对于独立音乐人、内容创作者和音乐爱好者来说，这简直是个高效创作的利器，以前创作一首完整歌曲可能要花很长时间，现在分分钟就能搞定一个雏形。
“Inspire”功能：另外，新上线的“Inspire”功能也很赞。它能让你从任何播放列表里获取灵感，快速生成新歌曲。它会分析播放列表里音乐的风格、情绪、元素，然后按照你的喜好，创作出符合你口味的音乐，不管是给短视频配乐、做播客背景音乐，还是设计游戏音效，都能轻松实现。

不过要注意，这些新功能目前只对Suno AI的 Pro 和 Premier 付费用户开放，免费用户也别灰心，还是可以用 v4.0 模型生成最多 20 首歌曲，或者用 v3.5 模型每天生成 10 首歌曲。而且，v4.5+在音质和创作体验上也有很大提升，音质更清晰、混音更平衡，提示增强助手还能帮你更好地控制音乐生成过程，歌曲时长也从 4 分钟延长到了 8 分钟，有更多空间创作复杂的音乐。有了Suno v4.5+，音乐创作的可能性变得无穷无尽，赶紧去试试，说不定你就是下一个音乐创作达人！

体验地址：Suno AI网页版官网入口