OpenAI推出GPT-5.2系列模型，针对不同场景提供Instant、Thinking与Pro版本-AITOP100,AI资讯

GPT-5.2

2025年12月12日凌晨，GPT-5.2正式上线啦！这次它带来了三个不同版本，分别是：GPT-5.2 Instant、GPT-5.2 Thinking和GPT-5.2 Pro。

这难道不让人好奇，不同版本究竟有啥独特之处呢？与之前的GPT-5.1相比，GPT-5.2在性能上可是有了质的飞跃，就好比小轿车升级成了超级跑车，速度和性能都大幅提升。

工具地址：GPT-5.2网页版官网（海外网站需要科学上网）

GPT-5.2正式上线

版本特色大揭秘

GPT-5.2 Instant：日常对话小能手

GPT-5.2 Instant主打日常对话场景，最大的特点就是快！就像闪电一样，能在瞬间给出回应，让你在和它交流时毫无等待的烦恼。无论是闲聊八卦，还是咨询一些日常小知识，它都能迅速接招，让对话流畅又愉快。

GPT-5.2 Thinking：深度任务小专家

GPT-5.2 Thinking则专注于深度任务，像代码编写、长文档处理、数学难题解答以及规划制定等，它都不在话下。就好比一个全能学霸，面对各种复杂的知识和任务，都能有条不紊地进行分析和解决。

在代码方面，它对多种语言的掌握更加熟练，前端能力也显著提升，尤其是3D和复杂UI设计，单prompt就能生成令人惊艳的效果。在长文档处理上，它对多个信息点的整合能力超强，在OpenAI MRCRv2测试中，在256k token长度下接近100%准确率，是第一个达到如此高水平的模型。

GPT-5.2 Pro：难题克星大魔王

GPT-5.2 Pro堪称最强版本，专门为解决难题而生。如果你遇到特别棘手的问题，愿意花时间等待，那选它就对了。在AIME 2025考试中，它取得了满分的好成绩，在ARC - AGI - 1上更是第一个突破90%大关，达到了90.5%，在ARC - AGI - 2上也拿到了52.9%（和Gemini3相当），实力可见一斑。

核心评测：实力见证

1.在核心评测方面

GPT-5.2的表现相当亮眼。在AIME 2025考试中，GPT - 5.2 Pro无工具的情况下获得满分，这可是相当了不起的成就。

在ARC-AGI-1测试中，GPT-5.2 Thinking达到86.2%，Pro版达到90.5%，成为首个突破90%的模型；

ARC - AGI - 2测试中，GPT - 5.2 Thinking从GPT - 5.1的17.6%提升到了52.9%，Pro版为54.2%，成绩翻了三倍还多。

GPT-5.2

2.在处理真实工作任务方面

GDPval是OpenAI新推出的基准测试，涵盖了44个职业的真实工作任务，像做PPT、做表格、写分析报告等。GPT - 5.2 Thinking在70.9%的任务上胜过或打平行业专家，GPT - 5.2 Pro更是高达74.1%，而且速度是人类专家的11倍，成本却不到1%，这效率简直逆天。

有评审员评价说：“看起来像是一个有员工的专业公司做的，布局和建议都很专业，虽然还有一些小错误需要修正。”在投行分析师的表格建模任务上，如给Fortune 500公司做三表模型、做LBO模型，平均分从59.1%提升到68.4%。

GPT-5.2

3.在代码能力测试中

SWE - Bench Pro是比SWE - bench Verified更难的新代码基准测试，涉及四种语言，更接近真实软件工程。GPT - 5.2 Thinking得分55.6%，而GPT - 5.1是50.8%，进步明显。

GPT-5.2

4.视觉能力上

GPT - 5.2也提升显著，错误率基本减半。在CharXiv Reasoning科学论文图表问答中，准确率达到88.7%，GPT - 5.1是80.3%；

在ScreenSpot - Pro GUI截图理解中，准确率达到86.3%，GPT - 5.1是64.2%。

GPT-5.2

而且它对空间位置的理解更强了，在主板识别对比中，GPT - 5.1只能标注几个组件且位置不太对，

而GPT - 5.2能准确标注各个组件，位置基本正确。

GPT-5.1 主板识别清晰度模糊

GPT-5.2

GPT-5.2 主板识别清晰度很高

GPT-5.2

5.数学和科学方面

GPT - 5.2同样表现出色。在HMMT 2025年2月考试中，Pro版获得100%的成绩；GPQA Diamond测试中，Pro版达到93.2%；FrontierMath Tier 1 - 3为40.3%，Tier 4为14.6%；HLE（Humanity's Last Exam）无工具时为34.5%，有工具时为45.5%。

GPT-5.2