DeepSeek-Prover-V2-671B

采用形式化定理证明的高级数学推理

DeepSeek-Prover-V2-671B 代表着AI驱动数学推理的突破性进展，基于DeepSeek强大的V3架构构建，拥有6710亿参数。这一专业模型在使用Lean 4证明助手进行形式化定理证明方面表现卓越，为数学问题求解和验证提供了前所未有的能力。

2025年4月发布

核心能力

形式化定理证明

利用Lean 4证明助手对数学陈述进行严格的形式化验证，确保绝对的逻辑精确性

数学推理

通过逐步推理解决复杂数学问题，展示解题过程以提高可解释性和验证性

错误检测

识别数学证明中的错误并提出修正建议，成为数学家的宝贵助手

研究助手

自动探索证明策略，协助数学家进行研究和定理发现

基准测试表现

miniF2F测试

92.5%

高中数学形式化证明基准测试，在代数、微积分和数论问题上表现卓越

MATH-500

99.1%

具有挑战性的数学问题，需要多步推理和高级问题解决技巧

ProofNet

45.3%

本科级数学基准测试，测试跨多个数学领域的形式化证明能力

AIME 2024

79.8%

美国数学邀请赛问题，代表具有挑战性的高中竞赛数学

应用场景

学术研究

协助数学家探索复杂定理并开发新的数学见解

教育支持

通过生成解释和Lean 4代码，帮助学生理解形式化证明

验证系统

通过形式化和证明正确性属性，增强软硬件验证系统

自动定理证明

以增强的推理能力为下一代自动定理证明系统提供动力

DeepSeek-Prover-V1 vs DeepSeek-Prover-V2

DeepSeek-Prover-V2在所有关键基准和能力方面都比其前身有了显著改进：

比较指标

提升

参数数量

70亿

6710亿

扩大96倍

miniF2F测试

63.5%

92.5%

+29.0%

ProofNet

25.3%

45.3%

+20.0%

证明长度

有限

扩展

提升2-3倍

技术架构

DeepSeek-Prover-V2利用DeepSeek的V3模型架构，并针对形式化定理证明进行了特定优化：

1基于DeepSeek的V3 6710亿参数基础，采用混合专家(MoE)架构
2在广泛的数学和形式化定理证明数据集上进行专业微调
3采用先进的证明助手反馈强化学习(RLPAF)
4增强型蒙特卡洛树搜索(MCTS)用于最佳证明探索
5128K令牌的上下文窗口，以处理复杂的数学陈述和证明

探索DeepSeek-Prover-V2文档