科学网—迟到的理解：原来我学的那些数学，都是AI需要的数学

速读：也就是说，我的本科训练并不是单纯的“证明定理”，而是很早就同时接触了数学结构、算法思维和计算实现。但在我自己看来，应用场景虽然变化很大，背后的数学结构并没有那么分散。第一件是数学建模竞赛。 PICB，也就是PartnerInstituteforComputationalBiology，是中国科学院与德国MaxPlanckSociety合作建立的计算生物学研究机构，聚焦系统生物学和复杂生物网络研究。后来又参加美国大学生数学建模竞赛，拿了M奖，也就是一等奖。

迟到的理解：原来我学的那些数学，都是 AI 需要的数学精选

已有 11739 次阅读

2026-5-17 17:01

| 个人分类: 科研 | 系统分类: 科研笔记

2025 年春天，我回到上海交大参加交大创业者大会的 AI 专场。会上，鄂维南院士作了一个关于“AI 时代需要什么样的人才”的报告。

听到一半，我突然有一种很强烈的感觉：原来我过去二十年里那些看似分散、甚至曾经让我困惑和痛苦的学习经历，并不是杂乱无章的。

数学、计算、图论、复杂系统、生物信息、机器学习、随机过程、网络科学、信息论、量子计算……这些东西在当年看起来像是互不相干的碎片。可是到了 AI 时代，它们突然连成了一条线。

那一刻，我才真正理解了自己为什么会自然地走向 AI 相关问题，也理解了为什么我过去接受的那种“很杂”的训练，恰恰可能是 AI 时代所需要的数学背景。

这篇文章，就想回顾一下我自己的这条非典型学习路径。

一、在上海交大学数学：数学、计算和应用的早期训练

2004 年到 2008 年，我在上海交通大学数学系读本科。

现在回头看，我一直觉得交大数学系当时的课程设置非常合理：既重视理论数学，也重视应用和计算。除了数学系通常会开的核心课程，我们还系统学习了很多高阶数学和应用数学内容，比如实变函数、泛函分析、拓扑、常微分方程、偏微分方程、数值计算、微分流形、时间序列分析、离散数学、随机过程、图与网络等。

与此同时，我们也上了不少计算机相关课程，包括 C、C++、数据结构等。也就是说，我的本科训练并不是单纯的“证明定理”，而是很早就同时接触了数学结构、算法思维和计算实现。

在课程之外，我大学里主要做了几件事。

第一件是数学建模竞赛。当时我参加全国大学生数学建模竞赛，拿了全国二等奖；后来又参加美国大学生数学建模竞赛，拿了 M 奖，也就是一等奖。数学建模给我的一个重要训练是：面对一个真实问题，如何把它抽象成数学模型，再通过计算和分析给出可操作的答案。

第二件是图论。我上了一些图论方面的讨论班，也参与过相关科研。后来回头看，图论其实是我整个学术路径中一条非常重要的暗线。从本科到博士，再到今天我做 AI 相关问题，图、网络、离散结构和组合关系一直没有离开过。

第三件是计算机图形学和计算机视觉。我当时自学了 OpenGL 和计算机图形学，也接触了计算机视觉，并参与发表了一篇 CVPR 论文。那时我并没有意识到，这些内容和后来深度学习时代的视觉 AI 会有如此深的联系。对当时的我来说，它们只是很有趣：几何、图像、算法和计算机程序可以结合在一起，让抽象的数学变成可见的东西。

【插图：计算机图形学经典的小红书】

我还去过 PICB 做暑期实习。PICB，也就是 Partner Institute for Computational Biology，是中国科学院与德国 Max Planck Society 合作建立的计算生物学研究机构，聚焦系统生物学和复杂生物网络研究。那段经历让我较早接触到生命科学中的计算问题，也让我意识到，数学并不只存在于黑板上，它也存在于基因、网络、演化和复杂生命系统中。

那时候，我还经常跟交大 ACM 班的朋友们混在一起。看着他们在学校旁边的微软、IBM 实习，拿着 PDA 这种早期移动设备开发应用，我也很自然地感受到计算机科学和软件工程正在改变世界。

只是那时我们还不知道，十几年后，这场变化会以 AI 的形式变得如此剧烈。

二、去德国马普所读博：没有固定 program 的跨学科训练

2008 年，我去了德国 Max Planck Institute for Mathematics in the Sciences 读博士。这个研究所直译过来是“马普科学中的数学研究所”，位于德国莱比锡，英文缩写是 MPI MIS。我们通常称它为马普应用数学所。

我的导师 Jürgen Jost 教授，是德国著名的几何分析学家。他曾是丘成桐先生的博士后，后来获得过德国科研界最高级别的综合性科研大奖之一——Gottfried Wilhelm Leibniz Prize，也就是莱布尼茨奖。他也是德国科学院和欧洲科学院院士。1996 年，他前往莱比锡共同创建 MPI MIS，并担任所长。

Jost 教授早年的研究以几何分析为主，后来相当一部分精力转向了跨学科数学和应用数学。他关心的问题非常广，从几何、分析到生物、神经科学、复杂系统、信息和认知科学都有涉及。我是他少数做应用和交叉方向的中国学生之一。

【插图：我和Jost 教授，2014年我的论文答辩】

不过，我当时的情况很特殊。

我是本科毕业后直接去德国的，没有硕士学位。那时德国还没有现在这样完整的本科—硕士—博士体系，传统上是 Diploma 体系，按中国的说法有点像本硕连读。所以像我这样从中国本科毕业后直接去读博士的学生，并没有一个清晰固定的 program。

因为不能直接进入标准博士流程，我需要先读一个类似“博士预科”的阶段。每年开学，除了上 MPI MIS 内部的课程以外，Jost 教授会拿出莱比锡大学数学系的课表，在上面给我“点课”。

现在回想起来，这些课点得非常有意思。它们包括泛函分析、高等概率论、机器学习、统计推断、R 语言和生物数据分析、Python、统计机器学习讨论班、范畴论、微分几何、图与网络、博弈论、随机过程、复杂网络、信息论、量子信息和量子计算、图上的随机游走、同步、fitness landscape 等等。

当时的我其实非常迷茫。

我刚刚本科毕业，面对的是一个极其开放的研究环境。我们组里的学生，有人做纯数学，比如几何、拓扑；有人来自物理；有人做经济；有人做神经科学、心理认知科学和生物学。每个人的问题都不一样，每个人的语言也不一样。

那时我经常想：我到底应该做什么？我是数学系出身，可是为什么我要学机器学习、统计推断、生物数据分析、信息论、复杂网络、量子计算？这些东西之间到底有什么关系？我未来究竟应该走哪个方向？

这种迷茫，在当时是真实而痛苦的。

可是多年以后，尤其是进入 AI 时代之后，我才慢慢明白，Jost 教授当年其实是在让我接受一种非常重要的训练：不要把数学看成一个封闭学科，而是要把数学看成理解复杂世界的语言。

今天回头看，那些课程几乎正好覆盖了 AI 时代所需要的几类数学基础：概率统计、机器学习理论、图论与网络、信息论、动力系统、随机过程、优化、复杂系统，以及面向生物、量子和计算科学的应用场景。

当年我以为自己学得太杂。现在才知道，那种“杂”，恰恰是一种很重要的准备。

三、复杂系统：我理解 AI 的另一条思想线索

除了数学和机器学习，我在博士期间还接触了很多复杂系统相关内容。

我曾经自学并慢慢翻译过 Melanie Mitchell 的《Complexity: A Guided Tour》。这本书是复杂系统领域非常好的入门读物，通俗地讲解了涌现、自组织、网络、混沌、演化、人工生命等核心概念。它给我的一个重要启发是：很多复杂现象并不是由某一个中心规则直接设计出来的，而是在大量简单个体的相互作用中自然产生的。

【Melanie Mitchell 的《Complexity: A Guided Tour》】

这也是复杂系统科学最吸引我的地方。

生命系统、社会系统、经济系统、生态系统、大脑、互联网，看起来差别很大，但背后都有一些共同问题：大量个体如何相互作用？局部规则如何产生全局结构？网络如何影响传播、演化和稳定性？复杂行为如何从简单机制中涌现出来？

今天看 AI，尤其是大模型，我们也会遇到类似的问题。

当然，我并不是说复杂系统和今天的大模型是同一件事。但在思想上，它们确实有某种延续性：智能不再被理解为少数几条显式规则的结果，而更像是在大规模网络、大量参数、大量数据和复杂训练过程中涌现出来的能力。

2010 年前后，复杂系统研究正处于一个非常活跃的阶段。复杂网络、演化动力学、群体智能、人工生命、系统生物学等方向，都在吸引大量来自数学、物理、生物、经济和计算机科学的研究者。

我也和几个朋友混过早期的集智论坛。那时我们关注复杂系统、网络科学、群体智能和人工生命，虽然还没有今天 AI 这么大的社会关注度，但很多问题意识已经在那里了。

复杂系统领域有一个“圣地”，就是位于美国新墨西哥州的 Santa Fe Institute，简称 SFI。

SFI 是世界著名的复杂系统研究机构，汇聚数学、物理、生物、经济、计算机科学、社会科学等领域的研究者，研究生命演化、复杂网络、金融市场、社会系统、人工生命和复杂经济学等问题。对很多复杂系统研究者来说，SFI 不只是一个研究机构，也代表了一种跨学科的科学传统。

我的两位博士论文导师，Jürgen Jost 和 Peter F. Stadler，都是 SFI 的客座教授。

Peter F. Stadler 是生物信息学家，化学博士，学术背景横跨数学、物理、化学和信息学。他是一个非常典型的“杂家”，但这种“杂”并不是浅尝辄止，而是能在不同学科之间看到共同结构。他也是奥地利科学院的通讯院士。

在两位导师的影响下，我逐渐走近复杂系统科学。2011 年，我被录取进入 Santa Fe Institute 的 Complex Systems Summer School。那一年，项目从全球申请者中选出约 50 名研究生和博士后。对当时的我来说，这是一次非常重要的跨学科训练。

在 SFI，我系统学习了复杂系统相关课程，也和来自世界各地的物理、生物、地理、经济学等不同背景的博士生和博士后一起完成项目。

那也是我第一次真正感受到美国西南部沙漠的广袤和干燥。

【插图：2011 年于 Santa Fe Institute】

在当时，来自中国大陆、并且以数学背景参加 SFI 暑期学校的学生并不多。那段经历对我后来理解复杂系统、网络科学和 AI 都产生了长期影响。四、图论：贯穿始终的一条隐藏主线

如果说我的学习经历表面上看起来很杂，那么其中始终有一条没有断过的线索：图论。

从本科时的图论讨论班，到后来阅读 Fan Chung 老师的《Spectral Graph Theory》，再到博士论文中的图同态问题，我一直对离散结构、网络关系以及结构之间的映射很感兴趣。

我当时还组织过一个讨论班，专门阅读 Fan Chung 老师的《图谱理论》。谱图理论把线性代数、组合数学和图论联系起来，用矩阵和特征值研究图的结构。今天回头看，这些内容和现代 AI 中的很多问题都有天然联系，比如图神经网络、知识图谱、网络表示学习、组合优化、芯片设计、分子结构、程序结构，甚至 AI for Mathematics。

2010 年左右，我开始写博士论文。阴差阳错地，也可能是出于自己的偏好，我最后的博士论文写得非常理论，研究的是图同态。这其实不是我两位导师最熟悉的方向。

我当时有一个很朴素的想法：读博士的时候如果不好好做一点理论，以后可能就再也没有这样的机会了。

所以，我选择了一个偏基础、偏组合数学、偏理论的问题。博士论文完成的过程当然并不容易，甚至可以说是另一个故事。但现在回看，这个选择对我后来的影响很大。

因为图同态本质上研究的是结构之间如何保持关系、如何映射、如何比较。这个问题在纯数学里是图论问题，在计算机科学里和约束满足问题、复杂性理论有关；而放到今天，它又和图表示、结构学习、知识表示、程序语义、神经符号方法等问题有某种深层联系。

很多人看到我后来做生物、量子计算、芯片设计、类脑、AI4Math，会觉得跨度很大。但在我自己看来，应用场景虽然变化很大，背后的数学结构并没有那么分散。

多问题的核心仍然是：结构是什么？关系是什么？映射是什么？约束是什么？局部信息如何决定全局性质？复杂网络中如何产生可计算、可学习、可解释的规律？

这些问题，正是图论、组合数学和复杂系统长期关心的问题。五、2014 年以后：从数学博士到大数据，再到 AI

2014 年，我完成了博士论文。

当时，凭借论文内容，导师建议我申请计算机博士学位。但我最后坚持要求拿数学博士学位。为此，我还多花了三个月自学高等概率论 II，也就是鞅过程等内容，并且有些艰难地通过了博士资格口试。

现在回头看，这个选择也很有意思。我的研究内容确实和计算机科学关系很近，但我内心深处仍然希望自己的学术身份是数学。我想保留那种从抽象结构和基本原理出发理解问题的训练。

博士毕业时，正是大数据时代。那时我收到过英国一家对冲基金公司的邮件，对方说我的一些师兄师姐在那里做得不错，他们认为我们研究所的学生非常适合这类工作，也邀请我过去。

我当时想都没想就拒绝了。那时我对金融没有兴趣。

后来由于个人原因，我去了加拿大 Calgary。那段时间，我考虑过找 data scientist 的工作，于是在 Coursera 上系统学习了一批大数据相关课程。可以说，我用一种比较自学的方式，把大数据时代的工具、编程和实际问题又重新过了一遍。

2015 年以后，我的研究逐渐转向更加应用的问题。不过一开始，我做的仍然是应用中的数学问题，也就是说，应用场景来自现实问题，但我关心的核心仍然是背后的数学结构和理论价值。

直到 2025 年，我开始更明确地做一些偏应用、偏 AI 的问题，包括生物、量子计算、芯片设计、类脑计算，以及 AI4Math。

很多人可能会觉得这些方向跨度很大。但对我来说，它们背后有共同的数学基础：组合结构、图论、网络、优化、概率、信息、复杂系统，以及不同结构之间的表示和映射。

AI 并不是一个突然从天而降的新方向。对我来说，它更像是一个汇合点，让我过去二十年里很多看似分散的训练，突然有了共同的语言。六、AI 时代需要什么样的数学？

过去几年，很多人都在讨论 AI 需要什么样的人才。有人强调工程能力，有人强调模型和算法，有人强调数据和算力。这些当然都重要。

但从我自己的经历看，AI 时代同样需要一种更深层的数学训练。

这种训练不只是会做题，也不只是会证明定理；不只是会调模型，也不只是会写代码。它需要人在抽象结构、计算实现和真实复杂系统之间来回穿梭。

比如，概率统计帮助我们理解不确定性、泛化和推断；优化理论帮助我们理解训练过程；信息论帮助我们理解表示、压缩和传输；图论和网络科学帮助我们理解关系结构；动力系统和随机过程帮助我们理解演化、稳定性和长期行为；复杂系统帮助我们理解涌现、自组织和多尺度相互作用。

而这些，正是我过去很多年里不断接触、学习和研究的东西。

我并不是说自己早就预见了今天的 AI。恰恰相反，在很长一段时间里，我并不知道这些学习经历最终会通向哪里。甚至在博士早期，我常常觉得自己学得太杂，不知道未来要做哪个方向。

但是现在回头看，我反而觉得，正是这种跨学科、跨尺度、跨语言的训练，让我能够更自然地理解 AI。

AI 不是单一学科的问题。它不是纯数学，也不是纯计算机；不是纯工程，也不是纯应用。它既需要抽象，也需要实现；既需要理论，也需要数据；既需要算法，也需要对真实系统的理解。

从这个意义上说，AI 时代需要的数学人才，也许不是只会待在一个狭窄方向里的人，而是能够在不同知识体系之间建立联系的人。结语：那些曾经让我迷茫的东西，后来都连成了一条线

回顾自己的学习经历，我越来越觉得，很多事情在当时是看不清楚的。

本科时，我只是觉得数学、编程、建模、图形学、计算视觉都很有意思。博士早期，我面对马普所高度跨学科的环境，一度非常迷茫，不知道自己到底应该做什么。去 SFI 之后，我开始系统理解复杂系统、网络和涌现。写博士论文时，我又回到非常理论的图论和图同态问题。后来经历大数据时代，再到今天的 AI 时代，这些经历才慢慢连成一条线。

这条线的核心，也许就是：用数学理解复杂结构，用计算处理复杂关系，用跨学科思维面对复杂世界。

所以，当我今天开始做 AI 相关问题时，我并不觉得这是一个完全陌生的新领域。相反，我常常有一种迟到的理解：

原来我过去学过的那些数学，很多都是 AI 需要的数学。

原来那些曾经让我困惑的“杂学”，并不是绕路。

它们只是提前很多年，把我带到了今天这个位置。

转载本文请联系原作者获取授权，同时请注明本文来自龙旸靖科学网博客。链接地址： https://blog.sciencenet.cn/blog-3353914-1535218.html

上一篇：水生所开放日｜观生命进化树，寻血脉来时路下一篇：从摩尔定律到韬(τ)定律：关于三维光子芯片 PDA 的一点思考欢迎参加科学网十佳博文评选活动！主办单位：支持单位：

主题：数学|计算|数学建模竞赛