news 2026/4/16 2:48:40

DeepSeekMath-V2、DeepSeek-Prover、DeepSeek-Prover-V2

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepSeekMath-V2、DeepSeek-Prover、DeepSeek-Prover-V2

DeepSeekMath-V2

来自https://arxiv.org/pdf/2511.22570,个人感觉贡献远没有提出GRPO的DeepSeekMath大。简单来说思路就是Reward Model一部分输入从自己整一个meta_verification,一个GRPO过程变成了2个GRPO过程,通过meta_verification验证证明的过程对不对,这非常符合人类证明的过程。

DeepSeek-Prover(DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data)

大规模合成数据:DeepSeek-Prover从广泛的非正式数学问题集合(自然语言数据)出发,生成正式的需要进一步证明的数学陈述(statements),这些陈述使用Lean 4证明语言进行形式化。通过模型评分和假设拒绝方法对自动形式化陈述进行过滤,以选择高质量的陈述。这些陈述由DeepSeek-Prover的模型进行证明,其正确性由Lean 4进行验证,从而生成经过验证的正式陈述和证明。
双重并发证明搜索:针对每个合成语句,DeepSeek-Prover同时搜索其正面陈述(Γ ⊚ P)和否定陈述(Γ ¢ ¬P)的证明。一旦找到有效的证明,搜索就终止,从而加速证明的合成过程。
迭代优化:新生成的经过验证的陈述和证明被用作微调DeepSeek-Prover的合成数据,进一步迭代模型。通过多轮迭代,模型生成的定理证明对的质量越来越高,从而不断提升模型在形式定理证明中的能力。


这是一个例子:

来源

  1. https://www.xiaohongshu.com/explore/66a7ca6e000000000600f2b1?xsec_token=ABhuYcPVrRIYgvR8hjVybi_q0OrgNhIUjHxnCzXqk8_UE=&xsec_source=pc_search&source=web_search_result_notes
  2. https://arxiv.org/pdf/2405.14333

DeepSeek-Prover-V2(DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition)

还是形式化语言证明:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 17:15:29

SIR-3000地质雷达信号弱处理方法

SIR-3000作为雷达探测仪器,信号强弱直接影响数据采集精度,其信号弱问题主要源于连接、参数设置、环境干扰或硬件异常,可按以下步骤逐步排查处理,优先操作简单易上手的项,再推进至专业调试,确保高效解决问题…

作者头像 李华
网站建设 2026/4/13 22:58:43

数据科学和临床数据科学的发展

下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容(原文7310字)。 1篇1章1节:医药数据科学的历程和发展,用R语言探索数据科学(更新20241029)_《用r探索医药数据科学》-CSDN博客 一、数据科学和临床…

作者头像 李华
网站建设 2026/4/14 23:21:00

开始开发网络版的APP

主要目的是:复习Django,因为不复习一下,就全都忘记了。作为app后端,当然要做到熟练。我们的服务器既然在国外,那就不用担心什么许可证的问题。还可以先上架一些有用的服务:比如在线文件格式转换什么的。

作者头像 李华
网站建设 2026/4/14 11:24:27

还没部署OpenClaw?2026年OpenClaw(Clawdbot)秒级部署图文步骤

还没部署OpenClaw?2026年OpenClaw(Clawdbot)秒级部署图文步骤!OpenClaw(原名Clawdbot/Moltbot)是一款开源的本地优先AI代理与自动化平台。它不仅能像聊天机器人一样对话,更能通过自然语言调用浏览器、文件系统、邮件等工具,完成整…

作者头像 李华
网站建设 2026/4/14 17:22:28

OpenClaw怎么部署?2026年OpenClaw(原Clawdbot)一键部署,手把手教学

OpenClaw怎么部署?2026年OpenClaw(原Clawdbot)一键部署,手把手教学。OpenClaw(原名Clawdbot/Moltbot)是一款开源的本地优先AI代理与自动化平台。它不仅能像聊天机器人一样对话,更能通过自然语言调用浏览器、文件系统、…

作者头像 李华