登录

科学网—迟到的理解:原来我学的那些数学,都是AI需要的数学


速读:也就是说,我的本科训练并不是单纯的“证明定理”,而是很早就同时接触了数学结构、算法思维和计算实现。 当时我参加全国大学生数学建模竞赛,拿了全国二等奖; 第一件是数学建模竞赛。 PICB,也就是PartnerInstituteforComputationalBiology,是中国科学院与德国MaxPlanckSociety合作建立的计算生物学研究机构,聚焦系统生物学和复杂生物网络研究。 后来又参加美国大学生数学建模竞赛,拿了M奖,也就是一等奖。
迟到的理解:原来我学的那些数学,都是 AI 需要的数学 精选

已有 204 次阅读

2026-5-17 17:01

| 个人分类: 科研 | 系统分类: 科研笔记

2025 年春天,我回到上海交大参加交大创业者大会的 AI 专场。会上,鄂维南院士作了一个关于“AI 时代需要什么样的人才”的报告。

听到一半,我突然有一种很强烈的感觉:原来我过去二十年里那些看似分散、甚至曾经让我困惑和痛苦的学习经历,并不是杂乱无章的。

数学、计算、图论、复杂系统、生物信息、机器学习、随机过程、网络科学、信息论、量子计算……这些东西在当年看起来像是互不相干的碎片。可是到了 AI 时代,它们突然连成了一条线。

那一刻,我才真正理解了自己为什么会自然地走向 AI 相关问题,也理解了为什么我过去接受的那种“很杂”的训练,恰恰可能是 AI 时代所需要的数学背景。

这篇文章,就想回顾一下我自己的这条非典型学习路径。

一、在上海交大学数学:数学、计算和应用的早期训练 2004 年到 2008 年,我在上海交通大学数学系读本科。

现在回头看,我一直觉得交大数学系当时的课程设置非常合理:既重视理论数学,也重视应用和计算。除了数学系通常会开的核心课程,我们还系统学习了很多高阶数学和应用数学内容,比如实变函数、泛函分析、拓扑、常微分方程、偏微分方程、数值计算、微分流形、时间序列分析、离散数学、随机过程、图与网络等。

与此同时,我们也上了不少计算机相关课程,包括 C、C++、数据结构等。也就是说,我的本科训练并不是单纯的“证明定理”,而是很早就同时接触了数学结构、算法思维和计算实现。

在课程之外,我大学里主要做了几件事。

第一件是数学建模竞赛。当时我参加全国大学生数学建模竞赛,拿了全国二等奖;后来又参加美国大学生数学建模竞赛,拿了 M 奖,也就是一等奖。数学建模给我的一个重要训练是:面对一个真实问题,如何把它抽象成数学模型,再通过计算和分析给出可操作的答案。

第二件是图论。我上了一些图论方面的讨论班,也参与过相关科研。后来回头看,图论其实是我整个学术路径中一条非常重要的暗线。从本科到博士,再到今天我做 AI 相关问题,图、网络、离散结构和组合关系一直没有离开过。

第三件是计算机图形学和计算机视觉。我当时自学了 OpenGL 和计算机图形学,也接触了计算机视觉,并参与发表了一篇 CVPR 论文。那时我并没有意识到,这些内容和后来深度学习时代的视觉 AI 会有如此深的联系。对当时的我来说,它们只是很有趣:几何、图像、算法和计算机程序可以结合在一起,让抽象的数学变成可见的东西。

9bfd21b99a6ed783daed645bce455e2a.jpg

【插图:计算机图形学经典的小红书】

我还去过 PICB 做暑期实习。PICB,也就是 Partner Institute for Computational Biology,是中国科学院与德国 Max Planck Society 合作建立的计算生物学研究机构,聚焦系统生物学和复杂生物网络研究。那段经历让我较早接触到生命科学中的计算问题,也让我意识到,数学并不只存在于黑板上,它也存在于基因、网络、演化和复杂生命系统中。

那时候,我还经常跟交大 ACM 班的朋友们混在一起。看着他们在学校旁边的微软、IBM 实习,拿着 PDA 这种早期移动设备开发应用,我也很自然地感受到计算机科学和软件工程正在改变世界。

只是那时我们还不知道,十几年后,这场变化会以 AI 的形式变得如此剧烈。

二、去德国马普所读博:没有固定 program 的跨学科训练 2008 年,我去了德国 Max Planck Institute for Mathematics in the Sciences 读博士。这个研究所直译过来是“马普科学中的数学研究所”,位于德国莱比锡,英文缩写是 MPI MIS。我们通常称它为马普应用数学所。

我的导师 Jürgen Jost 教授,是德国著名的几何分析学家。他曾是丘成桐先生的博士后,后来获得过德国科研界最高级别的综合性科研大奖之一——Gottfried Wilhelm Leibniz Prize,也就是莱布尼茨奖。他也是德国科学院和欧洲科学院院士。1996 年,他前往莱比锡共同创建 MPI MIS,并担任所长。

Jost 教授早年的研究以几何分析为主,后来相当一部分精力转向了跨学科数学和应用数学。他关心的问题非常广,从几何、分析到生物、神经科学、复杂系统、信息和认知科学都有涉及。我是他少数做应用和交叉方向的中国学生之一。

2f916001d9637d2eecb992c1c21ff4cc.png

【插图:我和Jost 教授,2014年我的论文答辩】

不过,我当时的情况很特殊。

我是本科毕业后直接去德国的,没有硕士学位。那时德国还没有现在这样完整的本科—硕士—博士体系,传统上是 Diploma 体系,按中国的说法有点像本硕连读。所以像我这样从中国本科毕业后直接去读博士的学生,并没有一个清晰固定的 program。

因为不能直接进入标准博士流程,我需要先读一个类似“博士预科”的阶段。每年开学,除了上 MPI MIS 内部的课程以外,Jost 教授会拿出莱比锡大学数学系的课表,在上面给我“点课”。

现在回想起来,这些课点得非常有意思。它们包括泛函分析、高等概率论、机器学习、统计推断、R 语言和生物数据分析、Python、统计机器学习讨论班、范畴论、微分几何、图与网络、博弈论、随机过程、复杂网络、信息论、量子信息和量子计算、图上的随机游走、同步、fitness landscape 等等。

当时的我其实非常迷茫。

我刚刚本科毕业,面对的是一个极其开放的研究环境。我们组里的学生,有人做纯数学,比如几何、拓扑;有人来自物理;有人做经济;有人做神经科学、心理认知科学和生物学。每个人的问题都不一样,每个人的语言也不一样。

那时我经常想:我到底应该做什么?我是数学系出身,可是为什么我要学机器学习、统计推断、生物数据分析、信息论、复杂网络、量子计算?这些东西之间到底有什么关系?我未来究竟应该走哪个方向?

这种迷茫,在当时是真实而痛苦的。

可是多年以后,尤其是进入 AI 时代之后,我才慢慢明白,Jost 教授当年其实是在让我接受一种非常重要的训练:不要把数学看成一个封闭学科,而是要把数学看成理解复杂世界的语言。

今天回头看,那些课程几乎正好覆盖了 AI 时代所需要的几类数学基础:概率统计、机器学习理论、图论与网络、信息论、动力系统、随机过程、优化、复杂系统,以及面向生物、量子和计算科学的应用场景。

当年我以为自己学得太杂。现在才知道,那种“杂”,恰恰是一种很重要的准备。

三、复杂系统:我理解 AI 的另一条思想线索 除了数学和机器学习,我在博士期间还接触了很多复杂系统相关内容。

我曾经自学并慢慢翻译过 Melanie Mitchell 的《Complexity: A Guided Tour》。这本书是复杂系统领域非常好的入门读物,通俗地讲解了涌现、自组织、网络、混沌、演化、人工生命等核心概念。它给我的一个重要启发是:很多复杂现象并不是由某一个中心规则直接设计出来的,而是在大量简单个体的相互作用中自然产生的。

【Melanie Mitchell 的《Complexity: A Guided Tour》】

这也是复杂系统科学最吸引我的地方。

生命系统、社会系统、经济系统、生态系统、大脑、互联网,看起来差别很大,但背后都有一些共同问题:大量个体如何相互作用?局部规则如何产生全局结构?网络如何影响传播、演化和稳定性?复杂行为如何从简单机制中涌现出来?

今天看 AI,尤其是大模型,我们也会遇到类似的问题。

当然,我并不是说复杂系统和今天的大模型是同一件事。但在思想上,它们确实有某种延续性:智能不再被理解为少数几条显式规则的结果,而更像是在大规模网络、大量参数、大量数据和复杂训练过程中涌现出来的能力。

2010 年前后,复杂系统研究正处于一个非常活跃的阶段。复杂网络、演化动力学、群体智能、人工生命、系统生物学等方向,都在吸引大量来自数学、物理、生物、经济和计算机科学的研究者。

我也和几个朋友混过早期的集智论坛。那时我们关注复杂系统、网络科学、群体智能和人工生命,虽然还没有今天 AI 这么大的社会关注度,但很多问题意识已经在那里了。

复杂系统领域有一个“圣地”,就是位于美国新墨西哥州的 Santa Fe Institute,简称 SFI。

SFI 是世界著名的复杂系统研究机构,汇聚数学、物理、生物、经济、计算机科学、社会科学等领域的研究者,研究生命演化、复杂网络、金融市场、社会系统、人工生命和复杂经济学等问题。对很多复杂系统研究者来说,SFI 不只是一个研究机构,也代表了一种跨学科的科学传统。

我的两位博士论文导师,Jürgen Jost 和 Peter F. Stadler,都是 SFI 的客座教授。

Peter F. Stadler 是生物信息学家,化学博士,学术背景横跨数学、物理、化学和信息学。他是一个非常典型的“杂家”,但这种“杂”并不是浅尝辄止,而是能在不同学科之间看到共同结构。他也是奥地利科学院的通讯院士。

在两位导师的影响下,我逐渐走近复杂系统科学。2011 年,我被录取进入 Santa Fe Institute 的 Complex Systems Summer School。那一年,项目从全球申请者中选出约 50 名研究生和博士后。对当时的我来说,这是一次非常重要的跨学科训练。

在 SFI,我系统学习了复杂系统相关课程,也和来自世界各地的物理、生物、地理、经济学等不同背景的博士生和博士后一起完成项目。

那也是我第一次真正感受到美国西南部沙漠的广袤和干燥。

No photo description available.

【插图:2011 年于 Santa Fe Institute】

在当时,来自中国大陆、并且以数学背景参加 SFI 暑期学校的学生并不多。那段经历对我后来理解复杂系统、网络科学和 AI 都产生了长期影响。

四、图论:贯穿始终的一条隐藏主线 如果说我的学习经历表面上看起来很杂,那么其中始终有一条没有断过的线索:图论。

从本科时的图论讨论班,到后来阅读 Fan Chung 老师的《Spectral Graph Theory》,再到博士论文中的图同态问题,我一直对离散结构、网络关系以及结构之间的映射很感兴趣。

我当时还组织过一个讨论班,专门阅读 Fan Chung 老师的《图谱理论》。谱图理论把线性代数、组合数学和图论联系起来,用矩阵和特征值研究图的结构。今天回头看,这些内容和现代 AI 中的很多问题都有天然联系,比如图神经网络、知识图谱、网络表示学习、组合优化、芯片设计、分子结构、程序结构,甚至 AI for Mathematics。

2010 年左右,我开始写博士论文。阴差阳错地,也可能是出于自己的偏好,我最后的博士论文写得非常理论,研究的是图同态。这其实不是我两位导师最熟悉的方向。

我当时有一个很朴素的想法:读博士的时候如果不好好做一点理论,以后可能就再也没有这样的机会了。

所以,我选择了一个偏基础、偏组合数学、偏理论的问题。博士论文完成的过程当然并不容易,甚至可以说是另一个故事。但现在回看,这个选择对我后来的影响很大。

因为图同态本质上研究的是结构之间如何保持关系、如何映射、如何比较。这个问题在纯数学里是图论问题,在计算机科学里和约束满足问题、复杂性理论有关;而放到今天,它又和图表示、结构学习、知识表示、程序语义、神经符号方法等问题有某种深层联系。

很多人看到我后来做生物、量子计算、芯片设计、类脑、AI4Math,会觉得跨度很大。但在我自己看来,应用场景虽然变化很大,背后的数学结构并没有那么分散。

多问题的核心仍然是:结构是什么?关系是什么?映射是什么?约束是什么?局部信息如何决定全局性质?复杂网络中如何产生可计算、可学习、可解释的规律?

这些问题,正是图论、组合数学和复杂系统长期关心的问题。

五、2014 年以后:从数学博士到大数据,再到 AI 2014 年,我完成了博士论文。

当时,凭借论文内容,导师建议我申请计算机博士学位。但我最后坚持要求拿数学博士学位。为此,我还多花了三个月自学高等概率论 II,也就是鞅过程等内容,并且有些艰难地通过了博士资格口试。

现在回头看,这个选择也很有意思。我的研究内容确实和计算机科学关系很近,但我内心深处仍然希望自己的学术身份是数学。我想保留那种从抽象结构和基本原理出发理解问题的训练。

博士毕业时,正是大数据时代。那时我收到过英国一家对冲基金公司的邮件,对方说我的一些师兄师姐在那里做得不错,他们认为我们研究所的学生非常适合这类工作,也邀请我过去。

我当时想都没想就拒绝了。那时我对金融没有兴趣。

后来由于个人原因,我去了加拿大 Calgary。那段时间,我考虑过找 data scientist 的工作,于是在 Coursera 上系统学习了一批大数据相关课程。可以说,我用一种比较自学的方式,把大数据时代的工具、编程和实际问题又重新过了一遍。

2015 年以后,我的研究逐渐转向更加应用的问题。不过一开始,我做的仍然是应用中的数学问题,也就是说,应用场景来自现实问题,但我关心的核心仍然是背后的数学结构和理论价值。

直到 2025 年,我开始更明确地做一些偏应用、偏 AI 的问题,包括生物、量子计算、芯片设计、类脑计算,以及 AI4Math。

很多人可能会觉得这些方向跨度很大。但对我来说,它们背后有共同的数学基础:组合结构、图论、网络、优化、概率、信息、复杂系统,以及不同结构之间的表示和映射。

AI 并不是一个突然从天而降的新方向。对我来说,它更像是一个汇合点,让我过去二十年里很多看似分散的训练,突然有了共同的语言。

六、AI 时代需要什么样的数学? 过去几年,很多人都在讨论 AI 需要什么样的人才。有人强调工程能力,有人强调模型和算法,有人强调数据和算力。这些当然都重要。

但从我自己的经历看,AI 时代同样需要一种更深层的数学训练。

这种训练不只是会做题,也不只是会证明定理;不只是会调模型,也不只是会写代码。它需要人在抽象结构、计算实现和真实复杂系统之间来回穿梭。

比如,概率统计帮助我们理解不确定性、泛化和推断;优化理论帮助我们理解训练过程;信息论帮助我们理解表示、压缩和传输;图论和网络科学帮助我们理解关系结构;动力系统和随机过程帮助我们理解演化、稳定性和长期行为;复杂系统帮助我们理解涌现、自组织和多尺度相互作用。

而这些,正是我过去很多年里不断接触、学习和研究的东西。

我并不是说自己早就预见了今天的 AI。恰恰相反,在很长一段时间里,我并不知道这些学习经历最终会通向哪里。甚至在博士早期,我常常觉得自己学得太杂,不知道未来要做哪个方向。

但是现在回头看,我反而觉得,正是这种跨学科、跨尺度、跨语言的训练,让我能够更自然地理解 AI。

AI 不是单一学科的问题。它不是纯数学,也不是纯计算机;不是纯工程,也不是纯应用。它既需要抽象,也需要实现;既需要理论,也需要数据;既需要算法,也需要对真实系统的理解。

从这个意义上说,AI 时代需要的数学人才,也许不是只会待在一个狭窄方向里的人,而是能够在不同知识体系之间建立联系的人。

结语:那些曾经让我迷茫的东西,后来都连成了一条线 回顾自己的学习经历,我越来越觉得,很多事情在当时是看不清楚的。

本科时,我只是觉得数学、编程、建模、图形学、计算视觉都很有意思。博士早期,我面对马普所高度跨学科的环境,一度非常迷茫,不知道自己到底应该做什么。去 SFI 之后,我开始系统理解复杂系统、网络和涌现。写博士论文时,我又回到非常理论的图论和图同态问题。后来经历大数据时代,再到今天的 AI 时代,这些经历才慢慢连成一条线。

这条线的核心,也许就是:用数学理解复杂结构,用计算处理复杂关系,用跨学科思维面对复杂世界。

所以,当我今天开始做 AI 相关问题时,我并不觉得这是一个完全陌生的新领域。相反,我常常有一种迟到的理解:

原来我过去学过的那些数学,很多都是 AI 需要的数学。

原来那些曾经让我困惑的“杂学”,并不是绕路。

它们只是提前很多年,把我带到了今天这个位置。

转载本文请联系原作者获取授权,同时请注明本文来自龙旸靖科学网博客。 链接地址: https://blog.sciencenet.cn/blog-3353914-1535218.html

上一篇: 水生所开放日|观生命进化树,寻血脉来时路

主题:数学|计算|学习|数学建模竞赛