
2025年12月12日凌晨,GPT-5.2正式上线啦!这次它带来了三个不同版本,分别是:GPT-5.2 Instant、GPT-5.2 Thinking和GPT-5.2 Pro。
这难道不让人好奇,不同版本究竟有啥独特之处呢?与之前的GPT-5.1相比,GPT-5.2在性能上可是有了质的飞跃,就好比小轿车升级成了超级跑车,速度和性能都大幅提升。
工具地址:GPT-5.2网页版官网 (海外网站需要科学上网)

版本特色大揭秘
GPT-5.2 Instant:日常对话小能手
GPT-5.2 Instant主打日常对话场景,最大的特点就是快!就像闪电一样,能在瞬间给出回应,让你在和它交流时毫无等待的烦恼。无论是闲聊八卦,还是咨询一些日常小知识,它都能迅速接招,让对话流畅又愉快。
GPT-5.2 Thinking:深度任务小专家
GPT-5.2 Thinking则专注于深度任务,像代码编写、长文档处理、数学难题解答以及规划制定等,它都不在话下。就好比一个全能学霸,面对各种复杂的知识和任务,都能有条不紊地进行分析和解决。
在代码方面,它对多种语言的掌握更加熟练,前端能力也显著提升,尤其是3D和复杂UI设计,单prompt就能生成令人惊艳的效果。在长文档处理上,它对多个信息点的整合能力超强,在OpenAI MRCRv2测试中,在256k token长度下接近100%准确率,是第一个达到如此高水平的模型。
GPT-5.2 Pro:难题克星大魔王
GPT-5.2 Pro堪称最强版本,专门为解决难题而生。如果你遇到特别棘手的问题,愿意花时间等待,那选它就对了。在AIME 2025考试中,它取得了满分的好成绩,在ARC - AGI - 1上更是第一个突破90%大关,达到了90.5%,在ARC - AGI - 2上也拿到了52.9%(和Gemini3相当),实力可见一斑。
核心评测:实力见证
1.在核心评测方面
GPT-5.2的表现相当亮眼。在AIME 2025考试中,GPT - 5.2 Pro无工具的情况下获得满分,这可是相当了不起的成就。
在ARC-AGI-1测试中,GPT-5.2 Thinking达到86.2%,Pro版达到90.5%,成为首个突破90%的模型;
ARC - AGI - 2测试中,GPT - 5.2 Thinking从GPT - 5.1的17.6%提升到了52.9%,Pro版为54.2%,成绩翻了三倍还多。

2.在处理真实工作任务方面
GDPval是OpenAI新推出的基准测试,涵盖了44个职业的真实工作任务,像做PPT、做表格、写分析报告等。GPT - 5.2 Thinking在70.9%的任务上胜过或打平行业专家,GPT - 5.2 Pro更是高达74.1%,而且速度是人类专家的11倍,成本却不到1%,这效率简直逆天。
有评审员评价说:“看起来像是一个有员工的专业公司做的,布局和建议都很专业,虽然还有一些小错误需要修正。”在投行分析师的表格建模任务上,如给Fortune 500公司做三表模型、做LBO模型,平均分从59.1%提升到68.4%。

3.在代码能力测试中
SWE - Bench Pro是比SWE - bench Verified更难的新代码基准测试,涉及四种语言,更接近真实软件工程。GPT - 5.2 Thinking得分55.6%,而GPT - 5.1是50.8%,进步明显。

4.视觉能力上
GPT - 5.2也提升显著,错误率基本减半。在CharXiv Reasoning科学论文图表问答中,准确率达到88.7%,GPT - 5.1是80.3%;
在ScreenSpot - Pro GUI截图理解中,准确率达到86.3%,GPT - 5.1是64.2%。

而且它对空间位置的理解更强了,在主板识别对比中,GPT - 5.1只能标注几个组件且位置不太对,
而GPT - 5.2能准确标注各个组件,位置基本正确。
GPT-5.1 主板识别清晰度模糊

GPT-5.2 主板识别清晰度很高

5.数学和科学方面
GPT - 5.2同样表现出色。在HMMT 2025年2月考试中,Pro版获得100%的成绩;GPQA Diamond测试中,Pro版达到93.2%;FrontierMath Tier 1 - 3为40.3%,Tier 4为14.6%;HLE(Humanity's Last Exam)无工具时为34.5%,有工具时为45.5%。

6.在减少幻觉方面
在ChatGPT真实用户查询测试中,有错误的回复比例从8.8%降到6.2%,相对减少了30%。

价格与版本情况
价格方面,GPT - 5.2比GPT - 5.1贵了40%,GPT - 5.2 Pro的价格更是贵得离谱。不过官方解释说,虽然单价更高,但token效率更高,达到同样效果的总成本反而更低,而且ChatGPT订阅价格不变。
从版本推送情况来看,ChatGPT从今天开始向付费用户推送GPT - 5.2,包括Plus、Pro、Go、Business、Enterprise版本。如果现在还没看到,过几天再试试。GPT - 5.1在ChatGPT中还会保留三个月,之后下线。
API也已经上线,有gpt - 5.2(Thinking版)、gpt - 5.2 - chat - latest(Instant版)、gpt - 5.2 - pro(Pro版)。
还新增了xhigh reasoning effort,适合对质量要求最高的任务。
GPT - 5.1、GPT - 5、GPT - 4.1在API中暂时不会下线,Codex优化版也即将推出。

安全评估:贴心守护
在安全评估方面,GPT - 5.2延续了GPT - 5的safe completion研究,在自杀、自残、心理健康、情感依赖等敏感对话上的表现有了改进。还开始部署年龄预测模型,18岁以下用户会自动限制敏感内容。不过官方也表示,过度拒绝的问题还在改进中。

总结展望
这次GPT - 5.2的发布,无疑给AI领域带来了新的活力。三个版本各有所长,能满足不同用户在不同场景下的需求。虽然价格有所上涨,但性能的提升和效率的提高,也让它的性价比依然可观。

随着技术的不断进步,相信GPT - 5.2会在更多领域发挥重要作用,为我们带来更多的惊喜和便利。让我们一起期待它在未来的精彩表现吧!
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









