降本打击!AI编程神器Cursor发布Composer 2.5,性能硬刚GPT-5.5
AI编程领域迎来一个真正有冲击力的玩家。Cursor近日正式发布自研编程大模型Composer 2.5,基于月之暗面开源的Kimi K2.5模型基座微调打造——用中国开源模型打底,做出媲美国际顶尖水平的编程AI,这个路线本身就很值得玩味。
数据说话:在SWE-Bench多语言测试和CursorBench v3.1评测中,Composer 2.5分别拿到79.8%和63.2%,这个成绩已经能够平齐Anthropic Opus 4.7以及OpenAI GPT-5.5。更狠的是价格——每百万输入Token仅0.50美元,输出2.50美元,是竞争对手收费标准的极小一部分。
Cursor这次是下了血本的。团队投入了比前代产品多出25倍的合成任务数据,把高达85%的计算预算直接砸进强化学习与扩展训练。这种"暴力美学"式的研发投入,换来的就是性能的跨越式提升。
还有个细节值得注意:Cursor已经联合SpaceX以及xAI,在拥有百万级H100算力的Colossus-2集群上,以10倍的计算量从头训练下一代更具颠覆性的模型。Cursor不只是做一个编辑器插件,它在赌下一代编程智能体的底层基础设施。
详情查看: https://www.aitop100.cn/infomation/details/33841.html

免费公测倒计时:腾讯云两大主力AI模型5月27日转入正式商用,订阅+增购双模式上线
腾讯云官方发布重要公告,其智能体开发平台(Tencent Cloud ADP)中的两款核心大模型——Hy3preview和DeepSeek-V4-Pro,将于北京时间2026年5月27日10:00正式结束限时免费公测,全面转向商业化运营。
这个时间点选得颇有讲究。Hy3preview刚刚在OpenRouter上连续三周登顶全球调用量榜首,周调用量2.66万亿Token,结束免费期后依然保持第一——说明用户不是因为免费才用,而是真觉得好用。现在收费了,正好检验一下用户粘性。
计费模式上,平台采用"订阅+增购"组合:基础套餐分免费版、Skill Plan版、专业版、企业版四个梯度,月费从0元到4880元不等。免费版每个账号只能首次领取体验一个月,想长期使用得付费。专业版和企业版选年付可享受低至8.33折优惠,相当于付10个月用一年。
对于业务量波动大的用户,还可以增购预付费资源包,提供1万PU到1000万PU四种规格,售价10元至10000元,资源包有效期长达12个月。系统会优先抵扣套餐内自带资源,消耗完才动用预付费包——这个设计对控制成本还是挺友好的。

AI眼镜闯入城市服务:蚂蚁GPASS上线"城市伴游",边走边讲无需动手
继乌镇峰会期间"桐小乌"在乐奇AI眼镜上落地后,蚂蚁自研的智能终端可信连接技术框架GPASS正进一步拓展应用边界。近期,基于该技术的城市伴游功能已在乐奇AI眼镜新版本中正式上线。
这个功能的核心体验是:你戴着眼镜在杭州街头走,系统会根据你的位置自动讲解周边景点,支持即时问答、导航、第一视角内容记录与分享。不需要掏手机,不需要手动操作,边走边获取信息——这个体验如果做得好,确实比传统导览APP高了一个维度。
首个接入的城市文旅官方智能体是"杭小忆",标志着"镜游杭州"项目进入实际运行阶段。这个项目由杭州文旅、支付宝与乐奇联合打造。后续城市伴游功能还将逐步接入更多城市专用文旅智能体。
背后的技术支撑是GPASS的多模态意图理解:语音+图像+位置,三者结合精准捕捉用户需求。比较有意思的是"无需唤醒词即可开启对话"这个细节——系统能过滤环境噪音和无关意图,在特定场景下主动提供提示与讲解,从被动响应转向更连续的交互体验。AI眼镜从"能听能说"进化到"能懂你在哪儿、在做什么",这个跨越很关键。

加量不加价!Anthropic宣布Claude Design套餐Token上限翻倍,快速模式切换Opus 4.7
Anthropic今日在X平台发布官方公告,对其旗下生产力工具生态进行重大升级:将视觉创作工具Claude Design在所有订阅套餐中的Token上限提升一倍,同时将Claude Code的"快速模式"默认切换至最新一代主力模型Opus 4.7。
Claude Design是Anthropic今年4月推出的重磅视觉工具,支持对话式生成设计、原型构建及多源导入,但此前受制于上下文额度,复杂项目常面临中断困境。这次Token上限翻倍,对Pro、Max、Team及Enterprise全套套餐用户来说,意味着长上下文的连续迭代能力被彻底解放。
更实在的是性能提升:Claude Code快速模式接入Opus 4.7后,交互响应速度最高可提升至原有的2.5倍,能更高效地支撑代码快速修改、实时调试等高时效性任务。
价格方面,Anthropic保持了高度的商业克制。Opus 4.7与此前Opus 4.6在快速模式下的定价完全一致,维持每百万输入Token 30美元、输出150美元,且全量覆盖100万Token的上下文窗口,费率不随上下文长度变动。两款模型在快速模式下共享相同的速率限制池,企业用户无需担心额外配置成本。
模型地址:Claude官网(海外网站需要科学上网)

降维打击!豆包上线博物馆模式,5家官方AI讲解员意味着什么
在第50个国际博物馆日之际,字节跳动旗下AI应用豆包正式上线博物馆讲解模式。目前官方合作已覆盖中国国家博物馆、浦东美术馆、甘肃省博物馆、河北博物院、首都博物馆、中国美术馆等20余家国内头部文博机构。
更有意思的是,豆包与其中5家顶尖场馆(甘肃省博物馆、河北博物院、首都博物馆、中国美术馆、浦东美术馆)达成进一步合作,在相关重磅展览中直接担纲官方"AI讲解员"——这个信号很强烈:AI不再只是"辅助工具",而是正式进入官方服务体系,承担真实的公共服务职能。
从技术路径来看,这表明大模型应用正从通用线上对话演进为具备空间感知与垂直领域专业度的高拟真线下服务。文旅行业作为海量历史图文知识的承载者,天然是AI多模态能力落地的核心试验场。
豆包的战略拓展不仅展示了其在专业知识领域的对齐能力,也预示着"AI+文旅"正走向制度化、官方化的深度融合。当你在首都博物馆看展,耳边是豆包在讲解文物背景——这个画面,或许很快就会成为博物馆的标配场景。
详情查看: https://www.aitop100.cn/infomation/details/33840.html

你的书架能对话了!微信读书Skill上线,一个指令帮你理清三年读过的书
昨天,#微信读书Skill#词条突然冲上热搜,原因很简单:用户把微信读书账号授权给AI后,就能让智能助手帮你查书、理书架、算习惯、整笔记、推好书——以前得手动翻半天的事,现在一句话就能搞定。
这个Skill的核心是把你的阅读数据变成"可对话、可分析、可复用"的智能资产。具体有六大能力:查阅书架(一眼看清藏书全貌)、书籍搜索(书名作者评分一键获取)、阅读统计(自动分析时长天数偏好深度)、书籍详情(章节目录进度随时回溯)、笔记和划线(高光想法一键导出)、推荐好书(基于真实偏好推送书单)。
安装门槛不高:访问微信读书Skill页面,在WorkBuddy等工具中发送指令安装,然后扫码登录微信读书获取API Key配置完成即可。配置完成后随便问一句"我今年读了哪些书?",AI能准确返回结果。
更值得玩的是"阅读数据二次创作"的空间。你可以用提示词让AI深度复盘:今年读了哪些书?阅读时间主要集中在哪个时段?连续读书最长的是哪本书?这些问题的答案,以前散落在各个角落,现在可以一句话全部调出来。对重度阅读用户来说,这不只是效率工具,更是一个能陪你复盘成长的智能阅读伙伴。

全球第六!通义千问Qwen3.7狂飙上位,数学杀进全球第七
阿里云旗下通义千问大模型再次迎来关键迭代,全新的Qwen3.7-Max-Preview以及Qwen3.7-Plus-Preview已正式上线大模型竞技场Arena AI以及官方Qwen Chat。作为新一代旗舰预览版,这两款模型预计将在即将召开的阿里云峰会上正式向公众发布。
数据很硬:Qwen3.7 Max Preview的综合排名成功冲入全球第13位,直接助力阿里通义千问在整体实验室排名中挺进全球前六。在数学领域位列全球第7,在专家级应用、软件与IT、以及纯编程能力等关键子榜单中也悉数杀入全球前十。
视觉领域同样不俗:Qwen3.7 Plus Preview综合排名位居全球第16位,使得通义千问在视觉榜单上的实验室总排名跃升至全球第5。在专门针对高难度复杂指令的"专家竞技场"细分赛道中,Qwen3.7 Max Preview同样稳居全球第9。
不过有个细节需要注意:此次预览阶段仅支持"思考模式",意味着模型更专注于高难度逻辑推理与深度计算,而网页搜索和代码解释器等辅助工具在现阶段暂不可用。如果你想完整体验,可能要等正式版。
但就目前的基准成绩来看,通义千问在多模态与深度垂直应用领域的研发,已经步入世界前列。
详情查看: https://www.aitop100.cn/infomation/details/33843.html

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










