陶哲轩如何成为人工智能数学的布道者

📅 2026 年 6 月 9 日 📖 约 20 分钟 Quanta Magazine AI数学形式化验证

陶哲轩从不畏惧非传统想法。2014年11月，他出席了一场由五位杰出数学家组成的座谈会，他们都是首届突破奖数学奖得主，每人获得300万美元奖金。这些获奖者的对话范围从数学是被发明还是发现的（大多数数学家同意，至少感觉上像是发现），延伸到评估我们是否生活在数字模拟中的几率。“是的，我认为我们实际上不是真实的，”马克西姆·孔采维奇说，他在上世纪90年代在数学与物理交叉领域完成了最重要的工作。

然而在40分钟的讨论中，最令人难以置信的言论来自陶哲轩。他预测，未来数学家可能不再单独工作或两三人小组，而是同时与数百人合作项目。当这些合作结束时，他说——以他谦逊低调的方式——结果可能不是由人类审稿人而是由计算机检查。“有一天我们可能实际上不会用LaTeX写论文，而是用某种语言，聪明的软件会将其转换为形式语言，每隔一段时间你会得到一个编译错误——计算机不理解你是如何推导出这一步的，”他说。

这句话让活动主持人和其他获奖者感到荒谬，以至于相比之下模拟假设似乎合理。比数百位数学家合作更令人惊讶的是，这种合作会吸引陶哲轩——因为如果世界上有人适合单干，那就是他。

陶哲轩1975年出生于澳大利亚阿德莱德，比他的父母从香港移民到该国晚三年。他们长子与众不同的最初迹象很早就显现了。陶哲轩2岁时，他家人拜访朋友，父母发现他与几个6岁孩子聚在一起，在用木块演示如何计数。当被问及如何学会数数时，他回答是在《芝麻街》上看到的。五年后，陶哲轩7岁时开始学习微积分。

1985年春天的三周里，陶哲轩的父母带他来到美国，会见了当时在约翰霍普金斯大学的数学早慧少年研究主任朱利安·斯坦利。斯坦利称陶哲轩拥有他见过的最强数学能力。同年，陶哲轩在埃尔德什·帕尔访问阿德莱德期间遇到了这位著名数学家。一张著名照片显示，当时72岁、祖父般的埃尔德什低头阅读膝上的文件，而10岁的陶哲轩头发浓密乌黑，专注地看着，手指若有所思地托着下巴。

陶哲轩的年轻传奇在1986年参加国际数学奥林匹克时进一步增长。他第一年获得铜牌，以10岁年龄成为史上最年轻的铜牌得主。随后两年，他成为最年轻的银牌得主，最终成为最年轻的金牌得主。他的正规教育也以类似加速节奏进行。他15岁从当地阿德莱德的弗林德斯大学毕业，1992年秋与父亲登机前往新泽西，在普林斯顿大学开始数学博士学位。埃尔德什支持陶哲轩提前入学，在推荐信中写道：“我确信他将发展成一流的数学家，或许会成为真正伟大的数学家。”

埃尔德什是对的。到陶哲轩24岁时，他已经有了足够多的新发现，可以自由选择永久教职；他最终决定在加州大学洛杉矶分校定居。大约那时，他遇到了年轻英国数论学家本·格林。两人开始合作一个证明：某些称为等差数列的模式（其中集合中的数字以固定间隔递增，如7、10、13、16）必然出现在大素数集合中，尽管素数似乎沿着数轴随机分布。他们的证明成为陶哲轩早期职业生涯的标志性成果，助力他2006年获得菲尔兹奖，并将他推向数学界最高层。

陶哲轩本可以不与任何人合作就建立成功职业生涯，但那不是他喜欢的工作方式。他把与其他研究员合作视为发现新想法的主要途径——把你所知道的与我所知道的结合起来，看看会发生什么。

这种方法使陶哲轩的数学研究覆盖异常广泛的主题，从解析数论（包括关于素数的格林-陶定理）到分析（他研究描述流体行为的纳维-斯托克斯方程的性质），再到根据数字数据构建MRI图像的算法。（MRI合作源于陶哲轩与当时在加州理工学院的统计学家伊曼纽尔·坎德斯的对话，当时他们都在送孩子上幼儿园。）这种对协作发现的渴望也导致陶哲轩公开进行大量工作。2007年他开设博客，开始定期发表研究进展。到那时，陶哲轩不仅是数学领域最著名的数学家之一，也是世界上最著名的。他的博文备受关注，有时在评论区引发长篇讨论，陶哲轩热情参与其中。他这样做是因为觉得有趣，也希望对话能产生新想法。

大约同时，另一位早期数学博主也有类似想法。像陶哲轩一样，蒂莫西·高尔斯是著名研究数学家，喜欢公开交流。但高尔斯不像陶哲轩那样依赖评论区偶然灵感，而是希望以集中方式引导公众能量。2009年1月，他发表博文宣布希望促进一种新型“大规模协作数学”。他会在开放在线论坛上提出问题，“任何对这个话题有话说的人都可以加入”。他将其命名为Polymath项目。

陶哲轩加入其中。像高尔斯一样，他明白有些数学问题比其他问题更适合通过大规模协作解决。关键，正如陶哲轩在高尔斯最初博文下的评论中所写，是找到能“产生大量更简单的子问题……这些子问题可以大致并行处理”的问题。通过将大问题分解为单个情形，不同团队或个人可以独立工作，然后将结果作为更大整体的碎片组装起来。同时，陶哲轩知道Polymath模型最大的挑战可能是组织：协调贡献并确保所有贡献正确无误。

对于第一个Polymath项目，高尔斯提议改进一个称为Hales-Jewett定理的结果，涉及用两种颜色之一给网格单元格着色时出现的模式。经过几个月的工作，通过数十位数学家数千条评论的协调，这个小组证明了关于这些着色模式如何出现的更精确陈述。那年秋天，他们以首份此类数学论文的形式发布成果，署名笔名"D.H.J. Polymath“。高尔斯的实验成功了。它让许多数学家——专业和业余——共同工作，最终得到了一个证明。

接下来的十年里，又进行了15个Polymath项目，其中一些由陶哲轩领导，该倡议引起了主流关注。2011年10月29日，《华尔街日报》发表文章《新爱因斯坦将是分享的科学家》，报道Polymath项目”开创了一种解决问题的新方法“。

但另一方面，Polymath项目是一个超前于时代的想法。陶哲轩发现自己处于数学活动狂潮中心令人兴奋，但他认识到博客评论区作为协作平台有限。大规模开放协作增加了某种偶然发现的可能性，但同时也增加了众多参与者中任何人犯错的可能性。防止错误的唯一方法是主持人仔细检查所有工作。但这种调节瓶颈破坏了Polymath愿景。

陶哲轩真正追求的是科学发现的一种高效新形式。过了一段时间，他明白Polymath模型并不是答案。他认为，要实现它，需要某种计算机验证——一种自动检查贡献而非手工检查的方法。但考虑到2010年代的技术状况，这无异于期望开通去火星的客运服务。

陶哲轩多年来一直知道计算机验证的数学。他知道一些成功案例，但知道形式数学仍不切实际，大多数情况下所需努力远超其价值。尽管如此，陶哲轩对其潜力很感兴趣。在世界顶级数学家中，他几乎是唯一看到新数学研究方法潜力的人。

2022年7月，部分出于好奇，他开始组织一场关于计算机辅助数学研究的各种方式的研讨会。他组建了联合组织团队，包括当时世界上形式数学最引人注目的布道者凯文·巴扎德。

进入会议前，陶哲轩认为Lean（一种允许将数学证明编写为计算机代码并检查的软件）是复杂的程序，需要几个月才能学会。巴扎德说服他试一试。除了鼓励之外，陶哲轩感到有强烈责任以身作则——如果他继续推广机器辅助证明，就需要自己开始尝试。

2023年10月9日，陶哲轩在社交媒体上发帖：”我决定最终开始熟悉#Lean4交互式证明系统（必要时借助AI帮助我使用它）“。

在流行的数学家在线讨论论坛MathOverflow上，陶哲轩发现了一个关于Maclaurin不等式的问题。他决定将其作为形式化实验来回答。首先，他像典型数学论文那样写出证明。很短，只有10页。然后他转向真正目标：看看能否在Lean中将这个简单证明形式化。

起初，陶哲轩认为可能一周内完成，但很快被手工写数学与在Lean中键入证明之间的差异所困扰。陶哲轩注意到证明的难部分很容易在Lean中形式化，而简单部分却出奇地费劲。

在常规论文中，陶哲轩毫不费力地断言：如果你有三个都大于1的数，它们的和必然至少为3。但Lean不容忍断言，陶哲轩不得不在Mathlib（一个已形式化数学的数字库，Lean用户编写证明时使用）中查找一个引理来证明这个自明的关系。类似地，在非形式数学中，并不总是需要指定你使用哪个数制。例如，数字3同时是整数、自然数和实数。在他的原始论文中，陶哲轩可以直接写”3“而不指定他心中哪种类型的3。但在Lean中，他必须详细说明。陶哲轩发现他的证明不断编译失败，因为他忽略了在形式化的不同点指定正确类型。直到将近一个月后的11月6日，陶哲轩在他的博客评论中写道：”只是提醒一下，我已经成功地在Lean4中形式化了这篇论文的结果。“结果微不足道，他编写的形式化Lean代码也很糟糕。然而，陶哲轩现在正式成为Lean社区的一员。

在学习Lean的同时，陶哲轩继续从事许多其他研究项目。其中包括与长期合作者本·格林和蒂莫西·高尔斯，以及格林的前学生、现任加州大学圣地亚哥分校教授的弗雷迪·曼纳斯合作。这是精英合作者团队——高尔斯像陶哲轩一样获得了菲尔兹奖，而格林是该领域最受赞誉的数论学家之一。

该小组着眼于一个特定问题，涉及一个称为和集的数学对象。如果你有一个数字集合，可以用它来形成另一个相关集合：它的和集。和集由取第一个集合中每个唯一数字对的和构成。所有这些和共同构成原始集合的和集。

如果原始集合充满随机数，那么它的和集将相对较大。10个随机数的集合有大约50个数的和集（而1000个数的集合有大约50万个数的和集）。但如果原始集合不是随机数，而是遵循某种模式，它的和集会小得多，因为许多和会出现多次（并且你只在和集中包含每个和一次）。数字1到10就是一个例子——它的和集只包含17个数（而不是随机10个数集合预期的50个），因为许多和重复（1+6、2+5、3+4都等于7，你只在和集中输入一次7）。

除了和集很小之外，数字1到10也是等差数列的例子，因为它们以恒定间隔递增。计算机科学家Marton Katalin在1960年代提出的一个猜想断言，这并非巧合。她预测产生小和集的集合必须也包含长等差数列。高尔斯、格林和陶哲轩在2000年代初对这个问题的改进版本（称为多项式Freiman-Ruzsa猜想）取得进展，但最终陷入僵局。然后在2023年，陶哲轩、格林和曼纳斯再次拾起它，着眼于引入曼纳斯发展的概率论技术。

他们意识到通过将这些技术与高尔斯早期的想法结合，可能解决整个问题。他们将高尔斯纳入合作，四人组在2023年夏天稳步前进。到深秋，他们完成了。11月9日——就在陶哲轩将他的第一个形式化Lean证明上传到GitHub三天后——他们将证明上传到arxiv.org。

由于心中想着Lean，陶哲轩向三位合著者建议他们可以尝试形式化他们的论文。这项工作似乎是形式化的好候选，既因为它是重要结果，也因为它依赖相对简单的技术。他们不必花几个月时间向Mathlib添加先决材料——大多数必要定义已经存在。

然而，格林、高尔斯和曼纳斯对花时间学习Lean并不特别感兴趣。所以陶哲轩独自开始——尽管他知道他可能不会长期单独。他领导的任何项目都可能引起关注。

11月13日，陶哲轩在一个专注于Lean的聊天群中开辟了一个新频道。”大家好。我正在考虑启动一个项目，在Lean4中形式化蒂莫西·高尔斯、本·格林、弗雷迪·曼纳斯和我自己对多项式Freiman-Ruzsa（PFR）猜想的最新证明，“他写道。他将使用这个频道协调项目活动，并”乐意接受志愿者以任何他们认为有能力的方式为这个项目做贡献“。这是Polymath项目的重启，只是这次他们形式化现有结果，而不是试图证明新结果——而且所有工作将由Lean验证，意味着陶哲轩不必亲自检查。

一天之内，斯德哥尔摩大学的博士生Yaël Dillies为该项目建立了粗略蓝图，将证明分为13个部分。在每个部分中，陶哲轩确定了需要形式化的引理和定义序列。在典型数学论文中，引理——有助于构建大定理证明的更简单结果——可能约20行长，但在PFR形式化中，陶哲轩将证明分解为五行引理。他的目标是使证明尽可能模块化，让许多人能做出小贡献。

第一周，线程上的大部分活动是关于形式化证明所需但Mathlib中尚未包含的概率论基本概念。特别是，他们必须形式化香农熵——衡量数据源（如数字集合）的不确定性或无序度。但除了形式化数学，陶哲轩和其他人第一周还花时间弄清楚如何协作。最初，对话是自由形式的，陶哲轩发布他认为需要做的事情，其他人插话提出如何做的想法，很像Polymath项目在博客评论中展开的方式。

11月22日，陶哲轩发布了22个待处理引理的列表，并写道：”如果你想认领其中一个或多个引理，请在本线程中回复。“回复如潮涌来：”我想认领均匀随机变量的熵：)“伦敦几何与数论学院的博士生Paul Lezeau写道。”我打算尝试一般的纤维恒等式“，加州大学洛杉矶分校的博士生Aaron Anderson回复。

口口相传，越来越多的数学家加入努力。到11月底，陶哲轩像一个忙碌的志愿者协调员，自己很少编写Lean代码，而是专注于为他人寻找任务。11月28日，他写道：”考虑到随着PFR项目接近尾声，我们可能暂时有志愿者过剩，我想到了一个额外的小任务，可能有人愿意做。“46分钟后，Kim Morrison回复说他们已经完成了任务。”哇，这么快！谢谢！“陶哲轩回答。

甚至在形式化完成之前，Lean社区就开始讨论其意义。特别是，他们争论项目的效率是否标志着快速形式化的新时代，还是反映了陶哲轩的独特影响。在小组线程的总结帖子中，陶哲轩反思说他自己并没有编写大部分代码。”这实际上让我非常鼓舞，因为它向我表明，数学家可能在不具备广泛Lean编程技能的情况下领导Lean形式化项目（尽管可能至少需要足够专业知识来陈述引理，即使不证明它们）。“八分钟后，乌得勒支大学的数学家兼Mathlib倡议主任Johan Commelin回复：”我不想立即劫持这个线程，“然后质疑陶哲轩在项目中学到的教训是否具有普遍适用性。”当然，你在这个项目中得到了很多帮助，因为它的高知名度，“他写道。

Commelin还指出，虽然像PFR这样的项目参与起来有趣且激动人心，但年轻数学家申请学术职位时，贡献于此类项目并不会得到认可。”目前，尚不清楚形式化者（因为缺乏更好的职位描述）将如何被数学界认可，以及这些活动在就业市场上将如何被重视。“陶哲轩回复：”值得说的是，我非常乐意在推荐信中适当提及对项目的贡献。“

到2024年，陶哲轩已成为吹嘘机器辅助数学潜力的最突出公共声音。他在拜登总统的科学技术顾问委员会任职三年，并成为生成式人工智能工作组的联合主席。在2024年的两次重要演讲中，他表达了对新型数学协作的愿景：结合人类洞察力、大型语言模型的创造性以及形式验证系统提供的正确性保证。

他形成这种观点部分是因为他看到当前AI工具的明显局限。它们在解决直接问题或拥有大量先验数据的任务上表现优异，但在数学的前沿——那里几乎没有已发表的结果和训练数据——AI力不从心。在他早期使用LLM的实验中，他观察到它们像过度自信的本科生一样，提出建议却没有区分好坏想法的专业知识。

然而，陶哲轩心中有一条前进之路。他认为AI不会很快取代人类数学家，但他确实认为它特别适合帮助解决某些类型的复杂数学问题：可以分解为成千上万个小的、可管理的子问题的问题——本质上与适合Polymath项目的问题类别相同。在这种规模下，数学家可以使用AI解决最大部分最简单的子问题，其结果作为形式证明输出，Lean可以检查，然后他们亲自介入处理最难的剩余问题。2024年，陶哲轩向任何愿意听的人推广这个愿景，在PFR项目之后，他意识到如果真正相信这项工作，他需要站出来亲自领导。他也立刻知道他将从哪个问题开始。

那是一年前他偶然遇到的一个问题。2023年7月，MathOverflow上一个用户提出了一个看似简单的谜题。该用户写道，考虑一个像加法这样的运算。它可能遵循某些基本代数定律，如交换律（x + y = y + x）或结合律（(x + y) + z = x + (y + z)）。在许多情况下，定律之间没有关系——例如交换律不蕴含结合律。

MathOverflow的问题涉及两个特定定律之间的关系，另一个用户很快回答了。

但定律之间如何普遍关联的问题引起了陶哲轩的好奇。不是逐个解决谜题，陶哲轩开始勾勒一个粗略图表，显示不同可能代数定律如何相互关联。很明显这个图可能非常复杂。

他发现如果他将研究限制在恰好应用四次运算的代数定律上，大约有4694条定律需要处理。每条定律可能蕴含或不蕴含其他任何定律，创造了2200万条逻辑蕴含需要检查。一旦他检查完所有——要么通过证明它们成立，要么找到它们不成立的反例——他将完整了解这4694条定律如何相互关联。感觉正是他提议的新数学风格的合适规模。

陶哲轩将他的新事业称为”Equational Theories“，并于2024年9月25日在个人博客上宣布成立。开头他逐条列举了过去大规模公开数学合作困难的主要原因，然后写道：”证明助手语言，如Lean，提供了克服这些障碍的潜在方法。“

首先，陶哲轩和越来越多的志愿者测试了超过4000条定律对称为magma的简单数学结构。Magma是简化版的算术，是很好的起点，因为任何对magma不成立的定律都不可能蕴含其他更复杂的定律。参与者使用基本Python脚本快速测试了数百万个这样的简化系统，几天内解决了2200万潜在蕴含中超过99%。陶哲轩在第二天（9月27日）发帖说他对项目进展之快感到惊讶：”这个项目的进展远远、远远快于我的预期，而且扩展速度也大大超出预期——仅仅48小时，很大一部分蕴含很可能很快就会被解决！我以为三周的PFR项目很快，但这是一种疯狂的额外速度。“

一旦最简单的蕴含得到解决，Equational Theories的志愿者以去中心化方式转向自动定理证明器，这些证明器能够自己搜索问题解决方案，无需交互帮助。这些证明器，加上老式的人类独创性，逐一击破了开放问题。

像一个科学家看着自己的创造物活起来，陶哲轩欣赏着工作展开。”项目似乎成功地去中心化了；特别是，现在有很多我不完全了解的活动在进行。“他写道。

对许多数学家来说，陶哲轩的项目有趣但奇怪。巴扎德跟随进展，对社会实验着迷，但对Equational Theories的数学内容感到无聊。他认为它既基础又奇怪，尽管他钦佩陶哲轩的创造力。另一位著名数学家约翰·贝兹更直率。他说：”对我来说这似乎是对时间的巨大浪费，“然后承认他对大学橄榄球也有同感，而且很多人也喜欢。

一个月内，Equational Theories小组将2200万个问题缩小到238个。到11月底，他们减到138个。随着他们逐步攻克剩余情况，进展放缓。新年开始时，还有大约30个蕴含未解决，进展进一步减慢。到3月底，他们在仅四个问题上停滞了数周。贡献者尝试了剩余问题，但由于蕴含太少，许多人离开了；陶哲轩的更新频率从几乎每日降到每几周一次。

但解决全部2200万个蕴含从来不是Equational Theories的真正目标。出于纯粹好奇，陶哲轩想要完整版图的地图，现在他有了，只差几个细节。更重要的是，他将Equational Theories视为一种全新数学研究方式的试点项目——从这个意义上说，它是无可争议的成功。

在陶哲轩看来，Equational Theories是他希望成为”实验性“数学新时代的开场。他想到的是物理学领域已经发生的那种变革。物理学曾经主要是一门理论学科，单独思想家或小组合作者一次处理一两个问题——换句话说，它曾经很像数学现在的样子。但随着技术进步，出现了该领域的新实验分支——像CERN大型强子对撞机实验室的大规模合作，数百甚至数千具有专门技能的研究人员一起工作，产生海量数据。这些实验并没有取代理论，而是补充了理论，新结果在两种研究模式之间流动。

陶哲轩想象数学也会发生类似演变。他相信新的探究形式必然会导致新的见解，就像过去总是如此。当Equational Theories团队有条不紊地从他们的巨大表格中划掉蕴含时，他们偶然遇到了真正新颖的数学构造——比如”magma上同调"，这是群上同调概念的陌生扩展（群上同调是一个深刻且经过充分研究的领域，描述群何时可以或不可以以某些方式扩张）。陶哲轩联系了Equational Theories反对者、上同调专家约翰·贝兹，询问这个构造以前是否出现过。贝兹承认他从未遇到过。

对陶哲轩来说，这正是关键点。该项目表明数学可以用不同的、实验性的方式进行——并且在此过程中，它产生了真正新颖的东西。陶哲轩从未期望Equational Theories能揭示重大发现；他希望它展示一种新型数学机器的功效。从这个意义上说，它成功了。陶哲轩找到了一种新的数学研究方法，而且没有迹象显示他会回头。

阅读原文

📚 相关主题数学形式化验证

📬 订阅 AI Pulse