news 2026/2/22 8:42:09

刚刚,GPT-5.2Pro独立证明45年未解的埃尔德什猜想!菲尔茨奖得主陶哲轩:其中存在陷阱,但AI没犯错

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
刚刚,GPT-5.2Pro独立证明45年未解的埃尔德什猜想!菲尔茨奖得主陶哲轩:其中存在陷阱,但AI没犯错

数学家保罗·埃尔德什一生中提出了大量有趣的数学问题,有些是他自己完成的,有些是与合作者共同完成的。这些问题难度范围广泛,吸引了大量关注。如今,随着AI在数学推理能力上的提升,人们开始使用AI来解决未解决的埃尔德什问题。

刚刚,GPT-5.2Pro又破解了一道埃尔德什猜想。

论证过程由菲尔茨奖得主陶哲轩证明没有问题,并且给予了高度评价,称其为“AI 解决开放性数学问题中“最明确的案例之一”

这道题目是数论领域的“埃尔德什难题”(Erdős problem)第281号,由匈牙利数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系。

数学家保罗·埃尔德什一生中提出了大量有趣的数学问题,有些是他自己完成的,有些是与合作者共同完成的。这些问题难度范围广泛,吸引了大量关注。如今,随着AI在数学推理能力上的提升,人们开始使用AI来解决未解决的埃尔德什问题。

这次证明由数学家Neel Somani 推动,并在X上高调发帖,有不少网友纷纷恭喜GPT-5.2又解决了人类一大难题。

在其X帖子下方,有网友补充了相关信息:GPT-5.2Pro对这个问题提出了新的证明方法,但忽略了此前已有的相关证明。不过,据陶哲轩验证,GPT-5.2Pro的证明思路与之前的方法相当不同。

证明只用到GPT-5.2 Pro,多个模型交叉验证

目前GPT-5.2Pro对该问题的证明结果已被埃尔德什问题网站收录。在帖子下方的评论区,不少网友也在讨论AI的证明过程有何巧妙以及不足之处。

GPT-5.2Pro的证明思路是将算术密度问题转化为紧群上的测度与平移问题,利用遍历性排除正测度的“全避让”配置,并借助紧致参数空间上的单调一致收敛原理(Dini 定理),实现了从逐配置的有限逼近到统一有限截断的跃迁。

Gemini 3对这份数学证明的评价是:

这是一个数学上合理且优雅的证明。它正确应用遍历理论和拓扑学的概念来解决数论问题。我没有发现任何逻辑错误。

陶哲轩指出,GPT-5.2Pro的证明策略是“弗斯滕伯格对应原理”的变体,它是数学家在遍历理论与组合学交界处的标准工具,尤其依赖于背景中潜藏的“弱紧致性”。

但GPT-5.2Pro的使用方法略有不同,比通常论证更依赖伯克霍夫遍历定理。

网友natso26指出,他认为GPT-5.2Pro跟踪极限交换等细节时会出错,但在这道题中,将问题转化为遍历理论的语言,似乎能让大模型推理变得更容易。

陶哲轩肯定了他的看法。他指出,遍历理论中存在陷阱,即便是高度专业的人类遍历理论专家也有可能会犯错,但AI在这方面却没有出错——这也是令他印象深刻的地方。

他还将整个论证过程转换为无限组合论,亲自动手验证了一遍,最终得出结论:结果成立。

网友Quanyu Tang用GPT-5.2 Pro反复检查论证细节,结论是唯一需要补充严格性的地方在第二步,可以用法图引理(Fatou lemma)进行简短论证,以免完全使用遍历理论,让证明更加严峻。

他还尝试了另外两个模型:ChatGPT-5.2 Thinking无法搜索到解决该问题的相关参考文献;ChatGPT-5.1 Pro 也无法独立解决该问题。

不过陶哲轩指出这里用法图引理替代伯克霍夫遍历定理的说法是错误的,不等式方向相反:“我刚教完研究生测度论,这类错误见得太多了。”

随后他又确认其实是对补集应用法图引理,方向没问题,论证成立。

答案其实早就近在眼前

经过评论区诸多网友的讨论和挖掘,大家发现了一个意外的事实:这道题其实有更简单的解法,解题所需的两个关键定理——达文波特-埃尔多斯定理和罗杰斯定理,其实早在1936和1966年就已经提出了。

发现这一点的人是网友KoishiChan。达文波特-埃尔多斯定理是哈罗德·达文波特和保罗·埃尔德什于1936年发明的密度收敛定理,它指出:对于整数倍的集合,有几个不同的密度概念是等价的。

而罗杰斯定理则首次出现在1966年的《H. Halberstam 和 K. Roth,序列》的第五章。陶哲轩自己也在这篇论文中找到了对罗杰斯定理的引用,这一引用来自于法国数学家特南鲍姆(Gérald Tenenbaum)。

这样一来,事情就变得很有意思了:埃尔德什自己就是其中一条关键定理的发明者,那么为什么他当时没有意识到问题的解决思路呢?

陶哲轩立刻向特南鲍姆发邮件询问了此事。特南鲍姆在邮件中确认,基于这两条经典定理,对281号问题的解决方案是显而易见的。但至于为什么当时没有被解决,他推测可能是当时“问题的表述在某种程度上被改变了”,但没有人来判断问题的另一个预期版本,所以只能按原样处理。

因此,现在埃尔德什281号问题有两个解法:一个是GPT-5.2Pro提出的遍历论思路,另一个就是网友发现的基于达文波特-埃尔多斯定理和罗杰斯定理进行求解的方法。

网友natso26对这两种证明方法进行了比较,确认他们是不同的证明思路,只是存在一些概念重叠。

陶哲轩则感慨,罗杰斯定理没有得到应有的传播,连他自己也是直到网友发掘出来才知道这件事。

“它仅出现在 Halberstam-Roth 的书中,没有单独的出版参考文献,文献中也仅被引用过几次。即使是埃尔多斯在 1980 年与格雷厄姆准备长篇未解论文时,也未必想起罗杰斯定理。

也许整场讨论的一个贡献让研究筛选和覆盖全余关系的人们增加对罗杰斯定理的认识。

AI已经解决了多少埃尔德什问题?

一直以来,数学家埃尔德什的“问题列表”,就像一座知识的珠穆朗玛峰,考验着人类的极限。这些悬而未决的难题,悬赏金大多从几十美元到上万美元不等。

每当AI解决一道埃尔德什问题,都会被视为其数学能力的进一步突破,引发轩然大波。

AI已经解决了多少埃尔德什数学猜想?根据陶哲轩对于“AI对埃尔德什猜想的贡献”的github统计,包含最新解决的281号问题,AI已经在7道埃尔德什问题上完全自主生成解决方案。此外,人类与AI协作生成解决方案的问题有7道,AI发现新证据或为部分结果提出新证明的问题有19道。

当然,目前AI的主要贡献还在于文献检索。据陶哲轩统计,目前尝试使用AI来驱动文献综述的埃尔德什问题有80道,其中有的问题AI能找到完整解,有的能找到部分结果,也有很多问题目前还未能发现显著结果。

陶哲轩在Github主页上写道:埃尔德什问题的难度差异很大(相差数个数量级),一端是非常有趣但极其困难的问题,另一端则是“长尾”未被充分探索的问题,其中许多是“低垂的果实”,非常适合被当前 AI 工具挑战。

他冷静地指出,尽管AI解决埃尔德什问题的消息或报道时常传出,但这并不意味着AI的数学推理能力有人们想象的那么乐观。

在评估 AI 工具的真实成功率时,最大统计偏差之一是强烈的报告偏见,负面结果几乎不会被披露。

如果个人或人工智能公司研究团队将其 AI 工具应用于未解决的问题,但没有实质性进展,用户几乎没有动力去举报该负面声明;此外,即使这些结果被报道,它们在社交媒体上“病毒式传播”的可能性也低于积极结果。

因此,

人们在这些媒体上听到的实际结果往往高度偏向积极的结果。”

他推荐了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源项目,这一项目系统记录了前沿大语言模型应用于开放性问题(如埃尔德什问题)上的正面和负面结果。

陶哲轩指出,这些工具在埃尔多斯问题上的真正成功率实际上只有一两个百分点,但面对600多个未解的问题,依然能带来一批数量可观且不平凡的AI贡献。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/19 6:58:26

计算机深度学习毕设实战-基于python-cnn机器学习识别水果是否成熟

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/20 5:10:34

5款AI PPT工具测评:免费又好用,这几款值得推荐!

5款AI PPT工具测评:免费又好用,这几款值得推荐!作为一名在职场摸爬滚打多年的打工人,我深知做 PPT 的痛苦。多少次,我正为一份精心制作的 PPT 沾沾自喜时,突然接到领导的临时需求,要求修改风格、…

作者头像 李华
网站建设 2026/2/18 2:42:39

写了那么多简历,我们是不是该停下来反思下工作到底该怎么找

📝 面试没过我就想着改一下简历,越改越迷茫对着招聘软件刷到眼酸,海投几十份石沉大海,深夜还在抠简历关键词,却从来没问过自己:我真的在找对工作吗?🤯 我们好像陷入了怪圈&#xff1…

作者头像 李华