OpenAI新编程模型GPT-5.1-Codex-Max:性能强价格优
2025年12月04日,OpenAI给开发者们带来了惊喜,正式推出全新编程模型GPT-5.1-Codex-Max。这一模型一登场,就成了大家热议的焦点。
它的亮点可不少。“代理式”编码能力超厉害,通过“压缩”技术,能在超百万tokens的上下文中稳定工作,内部测试能连续运行超24小时,处理复杂任务更稳了。在多项权威基准测试中,成绩相当突出,像SWE-Bench Verified等测试,得分比常规版有明显提升,处理多步骤开发任务优势明显。
商用方面,OpenAI也很有诚意。以和GPT-5相同的价格接入API,输入端每百万tokens1.25美元,输出端10美元。而且,它还针对Windows环境做了适配,和以往偏向Unix环境优化的Codex系列不同,这对用Windows开发的程序员来说太友好了。
现在,GPT-5.1-Codex-Max已经进入多款热门开发工具生态系统,像Cursor、GitHub Copilot等。在GitHub Copilot里,会向部分订阅用户开放,给程序员带来更高效的编码体验。
OpenAI推出这个新模型,也被看作是对竞争对手Anthropic的有力反击。Anthropic在企业级编码模型领域成绩不错,这次GPT-5.1-Codex-Max的推出,标志着OpenAI在开发者市场又有新布局,双方在高端开发工具领域的竞争会更激烈。对于开发者来说,这可是个好消息,有更多强大的工具可选啦。
工具地址:ChatGPT网页版官网(海外网站需要科学上网)

火山引擎豆包语音识别模型2.0:多语种识别更精准
火山引擎又有新动作啦,正式推出豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),这可是语音识别技术的一大进步。
这个新模型在继承前一版本优势的基础上,做了不少优化。它针对专有名词、人名、地名还有易混淆的多音字等难点,进行深度学习,在各种场景下都能提供更高的准确率。推理能力也更强了,依靠先进的PPO方案,不用依赖目标词汇历史记录,通过理解上下文就能精准识别。
更厉害的是,它具备多模态理解能力。用户发送图像后,模型能结合图像内容进行语音识别,更准确理解用户意图。比如描述有滑板的图像,传统模型可能误识别,它就能准确判断。
而且,它支持日语、韩语、德语、法语等13种海外语言精准识别,这大大拓展了它在跨语言应用场景中的使用,能提升全球用户的交互体验。
现在,豆包语音识别模型2.0已经在火山方舟体验中心上线,还提供API服务,企业和开发者接入很方便。火山引擎表示,未来会持续推动模型进化,在多模态、多场景下实现更精准的语音转文字服务,给大家提供更高效的解决方案。火山引擎这次的创新,肯定会给行业标准和用户体验带来积极影响。

诺顿正式上线全球首款安全AI浏览器Norton Neo,限时免费开放啦
网络安全公司诺顿又有新成果,其母公司Gen Digital推出的全球首款“安全AI原生浏览器”Norton Neo,正式向全球用户免费开放下载。
随着AI技术快速发展,网上体验变得复杂又难以信任,Norton Neo的目标就是让用户上网重新有安全感。它最早在今年5月以“抢先体验版”推出,现在全面开放了。
这个浏览器设计成数字助理型,强调“零指令”体验。用户不用记复杂指令,也不用频繁请求,浏览器会在合适时候主动帮忙。比如给长文章生成摘要,或者建议添加日历提醒,帮用户更好管理信息。
在隐私与个性化方面,它引入“可配置记忆”机制,用户能选择浏览器保留或忘记哪些信息,通过聊天界面就能轻松管理,在个性化体验和隐私保护间找到平衡。
安全上,它集成诺顿的Web Shield功能,能拦截恶意网站和网络钓鱼攻击,还内建广告拦截和隐私保护设计,降低用户浏览风险。诺顿强调,提供AI辅助功能时,始终把用户安全和隐私放首位。
Norton Neo主要特点有以隐私为先的安全防护、场景化AI辅助、智能标签页管理和可配置记忆功能。诺顿希望靠这些创新,让用户在AI新时代享受更安全高效的网络体验。大家不妨下载试试。
详情查看:全球首款安全AI浏览器Norton Neo免费开放下载

Vidu Q2“生图全家桶”上线:免费生图编辑转视频超实用
生数科技旗下的视频生成平台Vidu,正式发布Q2版本“生图全家桶”,给用户带来了不少惊喜。
这个新版本集成了参考生图、文生图与图像编辑三项核心能力。在图像生成控制力上提升明显,能精准指定画面位置、动作和整体构图,还支持4K画质输出。全新的图像编辑能力也很强大,支持局部重绘、材质替换等操作,在国际评测机构Artificial Analysis的相关榜单里获得较高评分。
更值得关注的是,新版本构建了从生图到视频的一站式工作流,已经广泛应用在广告、电商、短剧创作等领域,服务覆盖全球数千万用户。官方透露,新功能上线首日使用量就突破50万次,可见用户需求很强劲。
为了扩大使用规模,生数科技还推出限时免费活动。从现在起到12月31日,会员可以免费使用相关核心功能,旗舰版会员还能享受不限量生图权益。这对于有生图、图像编辑和图转视频需求的用户来说,简直是福音。
有了Vidu Q2“生图全家桶”,大家不用再为找不同的工具而烦恼,一个平台就能满足多种需求,而且还能免费使用,赶紧去体验体验吧。

KlingAI Avatar 2.0:一键生成5分钟唱跳,数字人超灵动
在AI视频生成领域,快手旗下可灵AI(KlingAI)发布的数字人模型Avatar2.0,可是带来了革命性突破。
这个新模型超厉害,只需输入一张人物照片和一段音乐音频,就能一键生成长达5分钟的唱歌视频。数字人不再是僵硬“对口型”的傀儡,而是能随旋律自然扬眉、眼神含笑、肢体起伏的“表演者”,这标志着AI内容创作从“静态”迈向了“动态叙事”。
它的核心创新在于多模态导演模块(MLLM Director),能将图像、音频和文本提示转化为连贯故事线。系统从音频提取语音内容和情感轨迹,从照片识别人像特征和场景元素,再融入文本提示,最终生成全局一致的“蓝图视频”。
相比前代,它在表情控制上进步巨大,笑、怒等情绪自然流露,动作设计也更灵活,全身表演和音乐完美契合。测试基准显示,在复杂歌唱场景下响应准确率高达90%以上。
它还支持48fps超高帧率与1080p高清输出,动画流畅度远超行业平均。用户可在可灵平台免费试用基础功能,高级长视频需订阅计划。上线首日生成视频量激增300%,用户反馈“情感真实”“操作简便”。
这一模型会影响短视频、电商广告等领域,让内容生产从“人力密集”转向“AI赋能”,不过也提醒大家注意版权与伦理问题。
工具地址:Kling AI网页版官网 (海外网站需要科学上网)
阿里云析言XiYan-SQL:全球SQL诊断评测强势夺冠
阿里云飞天实验室自主研发的数据分析智能体“析言XiYan-SQL”,最近在全球权威的SQL诊断评测基准BIRD-CRITIC(也称SWE-SQL)中表现出色,成功登顶所有开放榜单,超越了国内外不少顶尖团队,刷新了行业纪录。
BIRD-CRITIC基准由学术界和Google Cloud合作推出,题目涵盖企业中常见的数据库报错、性能问题和查询需求,涉及多种主流数据库系统,难度远高于传统测试。
在这项评测中,析言XiYan-SQL在BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG和BIRD-CRITIC-Flash三个重要榜单上都拿了第一,在跨方言鲁棒性、复杂SQL处理能力等多个维度得到验证。
技术上,它通过相关模式筛选、多生成器集成、候选重组与最优选择等创新手段,能生成高质量SQL,兼顾可执行性和可维护性,能在真实系统中提供高可用诊断与修复方案。
目前,基于XiYan-SQL技术打造的生成式商业智能(GBI)产品“析言”已在阿里云百炼平台上线,提供SQL生成与诊断服务。对于企业和开发者来说,有了这个强大的工具,处理数据库问题会更高效,大家不妨去体验体验。

谷歌Gemini上线Gemini 3 Deep Think模式:AI推理能力大提升
谷歌又有新动作啦,在Gemini应用中正式推出Gemini3Deep Think模式,面向Google AI Ultra订阅用户。这一新模式让AI推理能力显著提升,能应对复杂的数学、科学和逻辑问题,这些问题对当前先进模型都有挑战。
Gemini3Deep Think在多个严格基准测试中表现出色。在“人类最后的考试”中,未使用工具取得41.0%的成绩,在ARC-AGI-2测试中,使用代码执行达到45.1%。这得益于它采用的先进并行推理技术,能同时探索多个假设。
它是在Gemini2.5Deep Think基础上改进的,后者最近在国际数学奥林匹克竞赛和国际大学编程竞赛世界决赛中获得金牌标准。
Ultra订阅用户想体验这个强大功能很方便,在提示栏选择“Deep Think”模式,在模型下拉菜单选Gemini3Pro就行。
随着AI技术不断发展,谷歌推出的这个新模式,会给科研、教育等领域带来新的助力。对于从事相关工作的专业人士来说,有了更强大的工具来处理复杂问题。
相信在未来,Gemini 3 Deep Think模式会在更多场景发挥作用,大家不妨多关注关注。
模型地址:谷歌Gemini官网 (海外网站需要科学上网)

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









