刚刚,OpenAI 正式发布了 GPT-5.2。
Claude Opus 4.5、Gemini 3 Pro,这些原本都是世界顶级的模型,在 GPT-5.2 面前,数据差距肉眼可见。都要被按地上摩擦了!特别是 AIME 2025 这种数学竞赛,直接干到了 100%。
但我看完官方的所有信息,我的感觉是:OpenAI 这次不想和你聊“谁更聪明”。它想解决的是“能不能把活干完”。
如果不讲虚的,GPT-5.2 这次的变化,主要都在这 5 点。
1. 以后没有“一个模型”,只有“三种模式”
现在,OpenAI 把 GPT-5.2 拆成了三种角色:
•GPT-5.2 Instant(即时版):它很快,成本低。适合写邮件、翻译、改文案这种“短平快”的活。
•GPT-5.2 Thinking(思考版):它很稳。它会思考,适合做复杂的逻辑推理、写长文档、做数学题。
•GPT-5.2 Pro(专业版):它最强,也最贵。当你需要最高质量的结果,或者解决那种“掉头发”的难题时,就用它。
这其实是在帮你省钱。简单的活,不用杀鸡用牛刀;难的活,必须用重武器。
2. 不只是聊天,它是真的在“干活”
这次发布里,有个数据很吓人。在 SWE-Bench Pro(一个很难的代码测试标准)上,GPT-5.2 拿到了55.6%的分数,这是目前的最高分。
Notion、Zoom 这些大公司已经试用了。他们发现,GPT-5.2 特别擅长处理“长任务”。
• 你给它一堆乱七八糟的文档,让它整理成项目表。
• 你让它改一个复杂的代码库,它能记住上下文。
• 你让它按步骤执行一个流程,它不会做着做着就跑偏。
它能自己找资料、自己检查错误、自己补全中间的步骤。它给你的,不再是一个“大概的思路”,而是一个“能用的结果”。
3. 前端能力史诗级加强
早期测试者发现,GPT-5.2 Thinking 在前端开发和复杂的 UI 工作方面表现得格外强悍——尤其是涉及到 3D 元素的时候。
欣赏两个示例,都是一个提示词做出来的
比如这个海洋波浪模拟,光影、物理效果,都是一次成型。
Prompt: Create a single-page app in a single HTML file with the following requirements: - Name: Ocean Wave Simulation - Goal: Display realistic animated waves. - Features: Change wind speed, wave height, lighting. - The UI should be calming and realistic.还有这个节日贺卡
Prompt: Create a single-page app, in a single HTML file, that demonstrates a warm and fun holiday card! The card should be interactive and enjoyable for kids! - Have variety of items kids can drop in the UI; a few should be already placed by default - Also have fun sound interactions - Place many cute and fun stuff as much as possible - Animation like snowdrop should be used nicely4. 长记性,不靠死记硬背
以前我们说 AI “记性好”,通常是指它的窗口大,能塞进去几十万字。
但字塞进去了,它能不能记住重点?很难说。
GPT-5.2 Thinking 配合了一个新功能(API 里的/compact)。简单说,就是让模型在处理超长内容时,更能抓住重点线索。
它不会读了后面忘前面,对于写长篇报告、分析整个项目的代码非常有惊人的帮助。
5. 价格更精明:该省的省,该花的要花
大家最关心的价格,OpenAI 也给了明确的数字(每百万 tokens):
•输入:$1.75
•输出:$14
看着不便宜?但它有个大招:缓存输入打一折(90% 折扣)。
如果你是写代码,或者处理重复的文档,很多背景信息是不用反复算的。这一折下来,实际成本可能会大幅下降。
而且,因为它变聪明了,一次能把事情做对,不用反复重试。算总账,反而可能更省钱。
6. 安全不再是虚设
这次 OpenAI 居然把安全变成了产品能力。
它对敏感话题的处理更成熟了。特别是对于 18 岁以下的用户,它会自动识别并增加保护。这说明 GPT-5.2 已经准备好大规模进入教育和家庭场景了。
Claude Opus 4.5 很强,Gemini 3 Pro 也很猛。
但 OpenAI 这一手 GPT-5.2,打法变了。它不光是在卷“智商”,它在卷“靠谱”,要真的能干活和解决问题的能力。
往期推荐
Claude Code 算是被我玩明白了
Ant Design 6.0 来了!这一次它终于想通了什么?
15 个 Node.js 新功能替代流行 NPM 包
最后
欢迎加我微信,拉你进技术群,长期交流学习...
欢迎关注「前端Q」,认真学前端,做个专业的技术人...
点个在看
支持我吧