陶哲轩如何成为人工智能数学的布道者
陶哲轩从不畏惧非传统想法。2014年11月,他出席了一场由五位杰出数学家组成的座谈会,他们都是首届突破奖数学奖得主,每人获得300万美元奖金。这些获奖者的对话范围从数学是被发明还是发现的(大多数数学家同意,至少感觉上像是发现),延伸到评估我们是否生活在数字模拟中的几率。“是的,我认为我们实际上不是真实的,”马克西姆·孔采维奇说,他在上世纪90年代在数学与物理交叉领域完成了最重要的工作。
然而在40分钟的讨论中,最令人难以置信的言论来自陶哲轩。他预测,未来数学家可能不再单独工作或两三人小组,而是同时与数百人合作项目。当这些合作结束时,他说——以他谦逊低调的方式——结果可能不是由人类审稿人而是由计算机检查。“有一天我们可能实际上不会用LaTeX写论文,而是用某种语言,聪明的软件会将其转换为形式语言,每隔一段时间你会得到一个编译错误——计算机不理解你是如何推导出这一步的,”他说。
这句话让活动主持人和其他获奖者感到荒谬,以至于相比之下模拟假设似乎合理。比数百位数学家合作更令人惊讶的是,这种合作会吸引陶哲轩——因为如果世界上有人适合单干,那就是他。
陶哲轩1975年出生于澳大利亚阿德莱德,比他的父母从香港移民到该国晚三年。他们长子与众不同的最初迹象很早就显现了。陶哲轩2岁时,他家人拜访朋友,父母发现他与几个6岁孩子聚在一起,在用木块演示如何计数。当被问及如何学会数数时,他回答是在《芝麻街》上看到的。五年后,陶哲轩7岁时开始学习微积分。
1985年春天的三周里,陶哲轩的父母带他来到美国,会见了当时在约翰霍普金斯大学的数学早慧少年研究主任朱利安·斯坦利。斯坦利称陶哲轩拥有他见过的最强数学能力。同年,陶哲轩在埃尔德什·帕尔访问阿德莱德期间遇到了这位著名数学家。一张著名照片显示,当时72岁、祖父般的埃尔德什低头阅读膝上的文件,而10岁的陶哲轩头发浓密乌黑,专注地看着,手指若有所思地托着下巴。
陶哲轩的年轻传奇在1986年参加国际数学奥林匹克时进一步增长。他第一年获得铜牌,以10岁年龄成为史上最年轻的铜牌得主。随后两年,他成为最年轻的银牌得主,最终成为最年轻的金牌得主。他的正规教育也以类似加速节奏进行。他15岁从当地阿德莱德的弗林德斯大学毕业,1992年秋与父亲登机前往新泽西,在普林斯顿大学开始数学博士学位。埃尔德什支持陶哲轩提前入学,在推荐信中写道:“我确信他将发展成一流的数学家,或许会成为真正伟大的数学家。”
埃尔德什是对的。到陶哲轩24岁时,他已经有了足够多的新发现,可以自由选择永久教职;他最终决定在加州大学洛杉矶分校定居。大约那时,他遇到了年轻英国数论学家本·格林。两人开始合作一个证明:某些称为等差数列的模式(其中集合中的数字以固定间隔递增,如7、10、13、16)必然出现在大素数集合中,尽管素数似乎沿着数轴随机分布。他们的证明成为陶哲轩早期职业生涯的标志性成果,助力他2006年获得菲尔兹奖,并将他推向数学界最高层。
陶哲轩本可以不与任何人合作就建立成功职业生涯,但那不是他喜欢的工作方式。他把与其他研究员合作视为发现新想法的主要途径——把你所知道的与我所知道的结合起来,看看会发生什么。
这种方法使陶哲轩的数学研究覆盖异常广泛的主题,从解析数论(包括关于素数的格林-陶定理)到分析(他研究描述流体行为的纳维-斯托克斯方程的性质),再到根据数字数据构建MRI图像的算法。(MRI合作源于陶哲轩与当时在加州理工学院的统计学家伊曼纽尔·坎德斯的对话,当时他们都在送孩子上幼儿园。)这种对协作发现的渴望也导致陶哲轩公开进行大量工作。2007年他开设博客,开始定期发表研究进展。到那时,陶哲轩不仅是数学领域最著名的数学家之一,也是世界上最著名的。他的博文备受关注,有时在评论区引发长篇讨论,陶哲轩热情参与其中。他这样做是因为觉得有趣,也希望对话能产生新想法。
大约同时,另一位早期数学博主也有类似想法。像陶哲轩一样,蒂莫西·高尔斯是著名研究数学家,喜欢公开交流。但高尔斯不像陶哲轩那样依赖评论区偶然灵感,而是希望以集中方式引导公众能量。2009年1月,他发表博文宣布希望促进一种新型“大规模协作数学”。他会在开放在线论坛上提出问题,“任何对这个话题有话说的人都可以加入”。他将其命名为Polymath项目。
陶哲轩加入其中。像高尔斯一样,他明白有些数学问题比其他问题更适合通过大规模协作解决。关键,正如陶哲轩在高尔斯最初博文下的评论中所写,是找到能“产生大量更简单的子问题……这些子问题可以大致并行处理”的问题。通过将大问题分解为单个情形,不同团队或个人可以独立工作,然后将结果作为更大整体的碎片组装起来。同时,陶哲轩知道Polymath模型最大的挑战可能是组织:协调贡献并确保所有贡献正确无误。
对于第一个Polymath项目,高尔斯提议改进一个称为Hales-Jewett定理的结果,涉及用两种颜色之一给网格单元格着色时出现的模式。经过几个月的工作,通过数十位数学家数千条评论的协调,这个小组证明了关于这些着色模式如何出现的更精确陈述。那年秋天,他们以首份此类数学论文的形式发布成果,署名笔名"D.H.J. Polymath“。高尔斯的实验成功了。它让许多数学家——专业和业余——共同工作,最终得到了一个证明。
接下来的十年里,又进行了15个Polymath项目,其中一些由陶哲轩领导,该倡议引起了主流关注。2011年10月29日,《华尔街日报》发表文章《新爱因斯坦将是分享的科学家》,报道Polymath项目”开创了一种解决问题的新方法“。
但另一方面,Polymath项目是一个超前于时代的想法。陶哲轩发现自己处于数学活动狂潮中心令人兴奋,但他认识到博客评论区作为协作平台有限。大规模开放协作增加了某种偶然发现的可能性,但同时也增加了众多参与者中任何人犯错的可能性。防止错误的唯一方法是主持人仔细检查所有工作。但这种调节瓶颈破坏了Polymath愿景。
陶哲轩真正追求的是科学发现的一种高效新形式。过了一段时间,他明白Polymath模型并不是答案。他认为,要实现它,需要某种计算机验证——一种自动检查贡献而非手工检查的方法。但考虑到2010年代的技术状况,这无异于期望开通去火星的客运服务。
陶哲轩多年来一直知道计算机验证的数学。他知道一些成功案例,但知道形式数学仍不切实际,大多数情况下所需努力远超其价值。尽管如此,陶哲轩对其潜力很感兴趣。在世界顶级数学家中,他几乎是唯一看到新数学研究方法潜力的人。
2022年7月,部分出于好奇,他开始组织一场关于计算机辅助数学研究的各种方式的研讨会。他组建了联合组织团队,包括当时世界上形式数学最引人注目的布道者凯文·巴扎德。
进入会议前,陶哲轩认为Lean(一种允许将数学证明编写为计算机代码并检查的软件)是复杂的程序,需要几个月才能学会。巴扎德说服他试一试。除了鼓励之外,陶哲轩感到有强烈责任以身作则——如果他继续推广机器辅助证明,就需要自己开始尝试。
2023年10月9日,陶哲轩在社交媒体上发帖:”我决定最终开始熟悉#Lean4交互式证明系统(必要时借助AI帮助我使用它)“。
在流行的数学家在线讨论论坛MathOverflow上,陶哲轩发现了一个关于Maclaurin不等式的问题。他决定将其作为形式化实验来回答。首先,他像典型数学论文那样写出证明。很短,只有10页。然后他转向真正目标:看看能否在Lean中将这个简单证明形式化。
起初,陶哲轩认为可能一周内完成,但很快被手工写数学与在Lean中键入证明之间的差异所困扰。陶哲轩注意到证明的难部分很容易在Lean中形式化,而简单部分却出奇地费劲。
在常规论文中,陶哲轩毫不费力地断言:如果你有三个都大于1的数,它们的和必然至少为3。但Lean不容忍断言,陶哲轩不得不在Mathlib(一个已形式化数学的数字库,Lean用户编写证明时使用)中查找一个引理来证明这个自明的关系。类似地,在非形式数学中,并不总是需要指定你使用哪个数制。例如,数字3同时是整数、自然数和实数。在他的原始论文中,陶哲轩可以直接写”3“而不指定他心中哪种类型的3。但在Lean中,他必须详细说明。陶哲轩发现他的证明不断编译失败,因为他忽略了在形式化的不同点指定正确类型。直到将近一个月后的11月6日,陶哲轩在他的博客评论中写道:”只是提醒一下,我已经成功地在Lean4中形式化了这篇论文的结果。“结果微不足道,他编写的形式化Lean代码也很糟糕。然而,陶哲轩现在正式成为Lean社区的一员。
在学习Lean的同时,陶哲轩继续从事许多其他研究项目。其中包括与长期合作者本·格林和蒂莫西·高尔斯,以及格林的前学生、现任加州大学圣地亚哥分校教授的弗雷迪·曼纳斯合作。这是精英合作者团队——高尔斯像陶哲轩一样获得了菲尔兹奖,而格林是该领域最受赞誉的数论学家之一。
该小组着眼于一个特定问题,涉及一个称为和集的数学对象。如果你有一个数字集合,可以用它来形成另一个相关集合:它的和集。和集由取第一个集合中每个唯一数字对的和构成。所有这些和共同构成原始集合的和集。
如果原始集合充满随机数,那么它的和集将相对较大。10个随机数的集合有大约50个数的和集(而1000个数的集合有大约50万个数的和集)。但如果原始集合不是随机数,而是遵循某种模式,它的和集会小得多,因为许多和会出现多次(并且你只在和集中包含每个和一次)。数字1到10就是一个例子——它的和集只包含17个数(而不是随机10个数集合预期的50个),因为许多和重复(1+6、2+5、3+4都等于7,你只在和集中输入一次7)。
除了和集很小之外,数字1到10也是等差数列的例子,因为它们以恒定间隔递增。计算机科学家Marton Katalin在1960年代提出的一个猜想断言,这并非巧合。她预测产生小和集的集合必须也包含长等差数列。高尔斯、格林和陶哲轩在2000年代初对这个问题的改进版本(称为多项式Freiman-Ruzsa猜想)取得进展,但最终陷入僵局。然后在2023年,陶哲轩、格林和曼纳斯再次拾起它,着眼于引入曼纳斯发展的概率论技术。
他们意识到通过将这些技术与高尔斯早期的想法结合,可能解决整个问题。他们将高尔斯纳入合作,四人组在2023年夏天稳步前进。到深秋,他们完成了。11月9日——就在陶哲轩将他的第一个形式化Lean证明上传到GitHub三天后——他们将证明上传到arxiv.org。
由于心中想着Lean,陶哲轩向三位合著者建议他们可以尝试形式化他们的论文。这项工作似乎是形式化的好候选,既因为它是重要结果,也因为它依赖相对简单的技术。他们不必花几个月时间向Mathlib添加先决材料——大多数必要定义已经存在。
然而,格林、高尔斯和曼纳斯对花时间学习Lean并不特别感兴趣。所以陶哲轩独自开始——尽管他知道他可能不会长期单独。他领导的任何项目都可能引起关注。
11月13日,陶哲轩在一个专注于Lean的聊天群中开辟了一个新频道。”大家好。我正在考虑启动一个项目,在Lean4中形式化蒂莫西·高尔斯、本·格林、弗雷迪·曼纳斯和我自己对多项式Freiman-Ruzsa(PFR)猜想的最新证明,“他写道。他将使用这个频道协调项目活动,并”乐意接受志愿者以任何他们认为有能力的方式为这个项目做贡献“。这是Polymath项目的重启,只是这次他们形式化现有结果,而不是试图证明新结果——而且所有工作将由Lean验证,意味着陶哲轩不必亲自检查。
一天之内,斯德哥尔摩大学的博士生Yaël Dillies为该项目建立了粗略蓝图,将证明分为13个部分。在每个部分中,陶哲轩确定了需要形式化的引理和定义序列。在典型数学论文中,引理——有助于构建大定理证明的更简单结果——可能约20行长,但在PFR形式化中,陶哲轩将证明分解为五行引理。他的目标是使证明尽可能模块化,让许多人能做出小贡献。
第一周,线程上的大部分活动是关于形式化证明所需但Mathlib中尚未包含的概率论基本概念。特别是,他们必须形式化香农熵——衡量数据源(如数字集合)的不确定性或无序度。但除了形式化数学,陶哲轩和其他人第一周还花时间弄清楚如何协作。最初,对话是自由形式的,陶哲轩发布他认为需要做的事情,其他人插话提出如何做的想法,很像Polymath项目在博客评论中展开的方式。
11月22日,陶哲轩发布了22个待处理引理的列表,并写道:”如果你想认领其中一个或多个引理,请在本线程中回复。“回复如潮涌来:”我想认领均匀随机变量的熵:)“伦敦几何与数论学院的博士生Paul Lezeau写道。”我打算尝试一般的纤维恒等式“,加州大学洛杉矶分校的博士生Aaron Anderson回复。
口口相传,越来越多的数学家加入努力。到11月底,陶哲轩像一个忙碌的志愿者协调员,自己很少编写Lean代码,而是专注于为他人寻找任务。11月28日,他写道:”考虑到随着PFR项目接近尾声,我们可能暂时有志愿者过剩,我想到了一个额外的小任务,可能有人愿意做。“46分钟后,Kim Morrison回复说他们已经完成了任务。”哇,这么快!谢谢!“陶哲轩回答。
甚至在形式化完成之前,Lean社区就开始讨论其意义。特别是,他们争论项目的效率是否标志着快速形式化的新时代,还是反映了陶哲轩的独特影响。在小组线程的总结帖子中,陶哲轩反思说他自己并没有编写大部分代码。”这实际上让我非常鼓舞,因为它向我表明,数学家可能在不具备广泛Lean编程技能的情况下领导Lean形式化项目(尽管可能至少需要足够专业知识来陈述引理,即使不证明它们)。“八分钟后,乌得勒支大学的数学家兼Mathlib倡议主任Johan Commelin回复:”我不想立即劫持这个线程,“然后质疑陶哲轩在项目中学到的教训是否具有普遍适用性。”当然,你在这个项目中得到了很多帮助,因为它的高知名度,“他写道。
Commelin还指出,虽然像PFR这样的项目参与起来有趣且激动人心,但年轻数学家申请学术职位时,贡献于此类项目并不会得到认可。”目前,尚不清楚形式化者(因为缺乏更好的职位描述)将如何被数学界认可,以及这些活动在就业市场上将如何被重视。“陶哲轩回复:”值得说的是,我非常乐意在推荐信中适当提及对项目的贡献。“
到2024年,陶哲轩已成为吹嘘机器辅助数学潜力的最突出公共声音。他在拜登总统的科学技术顾问委员会任职三年,并成为生成式人工智能工作组的联合主席。在2024年的两次重要演讲中,他表达了对新型数学协作的愿景:结合人类洞察力、大型语言模型的创造性以及形式验证系统提供的正确性保证。
他形成这种观点部分是因为他看到当前AI工具的明显局限。它们在解决直接问题或拥有大量先验数据的任务上表现优异,但在数学的前沿——那里几乎没有已发表的结果和训练数据——AI力不从心。在他早期使用LLM的实验中,他观察到它们像过度自信的本科生一样,提出建议却没有区分好坏想法的专业知识。
然而,陶哲轩心中有一条前进之路。他认为AI不会很快取代人类数学家,但他确实认为它特别适合帮助解决某些类型的复杂数学问题:可以分解为成千上万个小的、可管理的子问题的问题——本质上与适合Polymath项目的问题类别相同。在这种规模下,数学家可以使用AI解决最大部分最简单的子问题,其结果作为形式证明输出,Lean可以检查,然后他们亲自介入处理最难的剩余问题。2024年,陶哲轩向任何愿意听的人推广这个愿景,在PFR项目之后,他意识到如果真正相信这项工作,他需要站出来亲自领导。他也立刻知道他将从哪个问题开始。
那是一年前他偶然遇到的一个问题。2023年7月,MathOverflow上一个用户提出了一个看似简单的谜题。该用户写道,考虑一个像加法这样的运算。它可能遵循某些基本代数定律,如交换律(x + y = y + x)或结合律((x + y) + z = x + (y + z))。在许多情况下,定律之间没有关系——例如交换律不蕴含结合律。
MathOverflow的问题涉及两个特定定律之间的关系,另一个用户很快回答了。
但定律之间如何普遍关联的问题引起了陶哲轩的好奇。不是逐个解决谜题,陶哲轩开始勾勒一个粗略图表,显示不同可能代数定律如何相互关联。很明显这个图可能非常复杂。
他发现如果他将研究限制在恰好应用四次运算的代数定律上,大约有4694条定律需要处理。每条定律可能蕴含或不蕴含其他任何定律,创造了2200万条逻辑蕴含需要检查。一旦他检查完所有——要么通过证明它们成立,要么找到它们不成立的反例——他将完整了解这4694条定律如何相互关联。感觉正是他提议的新数学风格的合适规模。
陶哲轩将他的新事业称为”Equational Theories“,并于2024年9月25日在个人博客上宣布成立。开头他逐条列举了过去大规模公开数学合作困难的主要原因,然后写道:”证明助手语言,如Lean,提供了克服这些障碍的潜在方法。“
首先,陶哲轩和越来越多的志愿者测试了超过4000条定律对称为magma的简单数学结构。Magma是简化版的算术,是很好的起点,因为任何对magma不成立的定律都不可能蕴含其他更复杂的定律。参与者使用基本Python脚本快速测试了数百万个这样的简化系统,几天内解决了2200万潜在蕴含中超过99%。陶哲轩在第二天(9月27日)发帖说他对项目进展之快感到惊讶:”这个项目的进展远远、远远快于我的预期,而且扩展速度也大大超出预期——仅仅48小时,很大一部分蕴含很可能很快就会被解决!我以为三周的PFR项目很快,但这是一种疯狂的额外速度。“
一旦最简单的蕴含得到解决,Equational Theories的志愿者以去中心化方式转向自动定理证明器,这些证明器能够自己搜索问题解决方案,无需交互帮助。这些证明器,加上老式的人类独创性,逐一击破了开放问题。
像一个科学家看着自己的创造物活起来,陶哲轩欣赏着工作展开。”项目似乎成功地去中心化了;特别是,现在有很多我不完全了解的活动在进行。“他写道。
对许多数学家来说,陶哲轩的项目有趣但奇怪。巴扎德跟随进展,对社会实验着迷,但对Equational Theories的数学内容感到无聊。他认为它既基础又奇怪,尽管他钦佩陶哲轩的创造力。另一位著名数学家约翰·贝兹更直率。他说:”对我来说这似乎是对时间的巨大浪费,“然后承认他对大学橄榄球也有同感,而且很多人也喜欢。
一个月内,Equational Theories小组将2200万个问题缩小到238个。到11月底,他们减到138个。随着他们逐步攻克剩余情况,进展放缓。新年开始时,还有大约30个蕴含未解决,进展进一步减慢。到3月底,他们在仅四个问题上停滞了数周。贡献者尝试了剩余问题,但由于蕴含太少,许多人离开了;陶哲轩的更新频率从几乎每日降到每几周一次。
但解决全部2200万个蕴含从来不是Equational Theories的真正目标。出于纯粹好奇,陶哲轩想要完整版图的地图,现在他有了,只差几个细节。更重要的是,他将Equational Theories视为一种全新数学研究方式的试点项目——从这个意义上说,它是无可争议的成功。
在陶哲轩看来,Equational Theories是他希望成为”实验性“数学新时代的开场。他想到的是物理学领域已经发生的那种变革。物理学曾经主要是一门理论学科,单独思想家或小组合作者一次处理一两个问题——换句话说,它曾经很像数学现在的样子。但随着技术进步,出现了该领域的新实验分支——像CERN大型强子对撞机实验室的大规模合作,数百甚至数千具有专门技能的研究人员一起工作,产生海量数据。这些实验并没有取代理论,而是补充了理论,新结果在两种研究模式之间流动。
陶哲轩想象数学也会发生类似演变。他相信新的探究形式必然会导致新的见解,就像过去总是如此。当Equational Theories团队有条不紊地从他们的巨大表格中划掉蕴含时,他们偶然遇到了真正新颖的数学构造——比如”magma上同调",这是群上同调概念的陌生扩展(群上同调是一个深刻且经过充分研究的领域,描述群何时可以或不可以以某些方式扩张)。陶哲轩联系了Equational Theories反对者、上同调专家约翰·贝兹,询问这个构造以前是否出现过。贝兹承认他从未遇到过。
对陶哲轩来说,这正是关键点。该项目表明数学可以用不同的、实验性的方式进行——并且在此过程中,它产生了真正新颖的东西。陶哲轩从未期望Equational Theories能揭示重大发现;他希望它展示一种新型数学机器的功效。从这个意义上说,它成功了。陶哲轩找到了一种新的数学研究方法,而且没有迹象显示他会回头。