Thinking about Physics and AI

blog
From the 2024/2025 Nobel Prize in Physics
Author

Tengyue Zhang

Published

July 23, 2025

自从我下定决心转行已经快过去了半年。半年间我学了很多东西,也吃了很多苦头。安逸于物理的稳定和有序已久,猛然惊醒方觉外界换了人间,恍如烂柯。而现在只不过是努力追赶时代脚步罢了。

半年间印象很深的,便是很多人问我,学物理的为什么要来搞 AI,是物理读不下去了还是只是单纯的跟风,或者则是兴趣满满问 AI 和物理怎么联系在一起。正好最近焦虑的发慌,便想写点东西来缓解一下。

Revised on 2025-11-23


2024 年的物理诺奖颁给了人工神经网络之父 Hinton,对物理专业的笔者而言,冲击无疑是巨大的。

笔者认为,自然科学和工程的发展无非是三个阶段的循环:Observation, Theory, Application. 物理学家,尤其是“传统”的物理学家,一般聚焦于观察和理论的阶段,致力于发现新的物理,无论是实验先验还是逻辑先验。

当然,我并没有排斥和贬低任何的工程科学,也没有反对物理学家使用工程师的思维来解决问题。 诚然,现代物理学体系日渐完善,前沿发展极端细分。 我所反对的,是物理学家困于工程师的思维尝试创造物理,但不能解释和分析之,也不能为社会带来实际的价值。 当物理学的工作变成调参,当领域细分的规律从普适逐渐变成了特殊,当物理学家需要用技术来理解研究对象时,物理学正在成为一种新的劳动密集型产业。 我不太清楚物理学的价值何在,我不太清楚物理研究的意义何在。

Paradigm of Physics Research

笔者自觉自己四大学的还可以,但是后面的内容,偏理论如广相场论,偏实验如光学凝聚态等等细分便不是很熟悉。 毕竟在同行继续向更深处迈进的时候,笔者已经转行去干完全不相干的 AI 了。 以前笔者自以为自己的理科背景,来 AI 这边应该可以很快的适应吧。然而,笔者现在才发现,从思维方式开始,物理就和 AI 之间存在着巨大的鸿沟。譬如,两者对于数学的态度。

如果说数学是一切自然科学的鼻祖,那么物理学则是一切实验科学和工程技术的鼻祖。物理学有着和数学差不多深的知识树,但是在严谨度和公理化程度方面欠缺(从量子力学中看到的诸多 axioms 可见一斑);她的普适性和抽象性,却又胜过化学、生物等其他描述性科学。这个特殊的地位,使得物理学在哲学意义上起到了一种桥梁的作用。顺水推舟,物理学的研究整体上可以被划分为理论和实验两个极端。

然而理论和实验,哪个才是物理的主流?回望人类历史,物理学靠着理论和实验两条腿走路,哪一条长一点短一点都硌脚。但是,物理学发展到现代,纯数学和纯实验都已经细分为完善的学科。虽然细分的领域仍然很“物理”,但是物理学的“主流”已经不再是这些方向。当代社会中不可或缺的计算机,其底层的晶体管/CMOS原理,难道和物理学没有关系吗?然而在当代大学中,至少在中国的大学找个物理系的本科生,除非 ta 是搞微电子方向的,那么大概率不知道这些数电的基本知识。物理学研究的是未知数,那些成熟的理论都已经转化为工科的一部分了。Maxwell 说过,Physics is the scientific study of matter, its fundamental constituents, its motion and behavior through space and time, and the related entities of energy and force.

所以,无论理论还是实验,都要像爱因斯坦所说一样,要分别出什么是“真正重要的研究”。以他的广义相对论为例,他在思考狭义相对论的时候,就已经意识到了引力的问题,但是他却没有解决问题的数学基础。当他告诉了他的朋友格罗斯曼时,格罗斯曼说:“你的想法是对的,但是你的数学是错的。”然后告诉他黎曼几何。这句话对物理学是一个很好的示例。现代物理学的研究方向有时过于细分,物理学的优点正是在于她的广度,使她可以有效的从数学和实验的两极借鉴知识。你能说黎曼几何不重要吗?当然不能。但是如果没有广义相对论,黎曼几何也许不会有现在这么大的影响力。所以,爱因斯坦对于引力时空的思想是“真正重要的”。毕竟,物理学的本质是研究自然规律,而不是单纯的数学或者实验技术。

谈谈物理学的美。杨先生说物理学表面有表面的美,深层有深层的美,它们的内涵往往随着物理学的发展而产生新的意义。我斗胆猜想,他的意思应该是赞美物理学的普适性。这种普适性能够跨越实验现象,唯象理论,理论架构,甚至数学的界限,使得物理学的美是一种全方位的美。这种美,正是物理学的魅力所在。


上述啰唆了这么多,无非是想说,物理学中对数学的依赖并不是那么的纯粹,因此从某种意义上来说,物理学和 AI 一样,都是“半公理化的”对数学的应用。而大多数情况下,物理和 AI 的研究方向是风马牛不相及的。话说到这个层面,那么结论也显而易见了。那些社会上对物理系学生容易转专业的刻板印象,不过是改开的教育红利罢。

AI for Physics?

AI 的风已经席卷到各行各业,物理学也不例外。大一的时候,笔者曾对最近五年的 Physics Review 系列论文的标题和摘要进行了引用统计,位于关键词云图中央的赫然是 Machine Learning。那时笔者不敢相信统计的数据,以为是把交叉学科的论文也统计进去了,遂手动删去了 Machine Learning 这个 stop word。直到 24 年诺奖结果公布,笔者才意识到,自己当时说不定已经看到了未来,至少是几年以内的未来。

从物理出来后,笔者也接触过一些 AI for Science 的项目,但是整体上都比较 trivial。绝大多数的项目都是想用 AI 来取代/加速原本的研究范式中一些比较 time-consuming 的步骤。或者是,单纯的为了 AI 而 AI,不知道 AI 的价值何在。

笔者以为,一个好的 AI for Science 课题要同时满足以下三个条件:

  1. 问题已经被良定义. 不同于 CV, NLP 等拥有诸多 benchmark 和具体任务的方向,AI4Sci 存在这一个重大的问题,即每个 domain 都是具体情况具体分析,甚至在某些领域根本就没有明确的任务。如果一个方向,连 baseline 都没有被定义,一个基本的 benchmark 都没有,那么说难听点,往会议灌水的时候连完整的故事都讲不清楚。
  2. 数据充足. 当前 AI 的主导范式是表征学习,只要数据足够,模型就能自动学习到有用的信息和结构。
  3. 物理机制不明确. 如果物理机制明确,那么 AI 的存在意义何在?AI 在科学中的价值不是“重现已知物理”,而是在中尺度问题上建立有效理论,在现有理论不确定或不可微(non-differentiable)时构建近似模型。因此,AI 最擅长“机制未定但数据可观”的领域,例如蛋白折叠、中尺度气象、复杂材料等。

非常可惜的是,物理学天生就不与 AI 适配。

第一,很多物理问题本身就不是良定义的。在物理学中,数据仅用于检验理论,而不是用于学习理论。一旦某个现象的理论解释不明确,物理学家的标准操作是构建新的理论,而不是让理论去 fit 这个模型。这意味着,物理的研究范式并不是让你去实现什么,而是去解释什么。

第二,物理学的实验数据往往非常稀缺。虽然说有很多方向的观测数据非常巨大,比如粒子和天体物理,但是这些数据往往是高度结构化、且信息含量极低,用传统的机器学习方法就可以很好的提取和分析。实验科学的数据稀缺性和昂贵性,使得深度模型天然处于欠定系统中。AI 能否取代传统统计方法、最大似然法、贝叶斯推断、凸优化等方法,仍然是一个值得商榷的问题。

第三,得于半公理化的体系结构,物理学既没法像数学那样提供从 lean 出发的公理化证明路线,又不能直接放手给 AI 去“学”物理。将物理嵌入到 AI 之中,让 AI 通过学习物理来获得物理的洞察,感觉目前并没有什么好的方法。是最致命的是,物理学的理论机制,或者说对实验现象的解释权,一直都是掌握来理论学家手中的。AI 并不具备,也不能具备在语境下提供新物理的能力。

AI for Physics 真正能做的,往往是在一些工程物理中,做一些理论已经明确,只不过数据量巨大的问题。比如材料科学,蛋白折叠,中尺度气象等。然而,如果都已经往工程上靠拢,那么去做 multimodal 和 NLP,岂不是更加的具有学术和社会价值?

Physics of AI

回到 subtitle, 其实说来神奇,当下流行的 NN 一开始是在研究多体问题中发现的。

在经典的 Ising 自旋体系中,当自旋耦合的结构足够复杂时,系统的能量景观往往会形成许多彼此分离的低能谷。这些低能构型对应着不同的稳定自旋排列,每一个稳定排列都可以被视为一种“模式”。系统在动力学演化中,无论从何处出发,都会被吸入这些低能谷之一,从而表现出类似记忆的特性。在统计物理中,这类现象被称作多稳定态,常见于自旋玻璃等复杂系统。

横场 Ising 模型是在这种经典结构上加入量子涨落:横向磁场使每个自旋都有概率发生翻转,从而能够在不同构型之间产生隧穿效应。尽管如此,只要横场的强度不至于压倒自旋耦合所决定的能量结构,这些原本的低能谷依然会保留下来。换句话说,量子涨落会在局部对稳定构型产生轻微扰动,但无法抹平整个能量景观。系统仍然拥有一系列相对稳定的量子态,它们与经典的自旋排列高度相似,并在动力学上继续充当吸引子。

在 Hopfield network 里,人们首次系统地把“模式存储”现象引入人工神经网络的语境:每个神经元只取两种离散状态,网络中所有连接是对称的,并通过一个类似能量的标量来刻画整体状态的“好坏”。当网络从一个带噪声的初始状态出发,按照局部规则异步更新时,这个能量会单调下降,最终把系统拉进某个稳定构型。每一个稳定构型对应一幅“记忆图像”或“模式”,不同的模式则对应能量景观里的不同谷底。这样,Hopfield network 就把“联想记忆”具体实现为:从不完整或受扰动的输入出发,通过动力学演化回到最近的稳定模式。

Hinton 提出了 Boltzmann machine、受限玻尔兹曼机等一系列模型,把“能量函数”当作统一的建模语言:你只要设计好能量函数,概率分布、采样过程以及学习目标就都随之确定。他进一步发展了近似学习算法,用有限步的随机演化来逼近真实的热平衡采样,从而在实际规模上训练这些能量模型,让其真正成为现代机器学习中的一个重要分支。

Future

GPT 只是三年前的产物,大名鼎鼎的 ds-r1 在年初问世,现在就被嘴刁的用户嫌弃。大多数人学习的速度赶不上 AI 技术迭代的速度,又有多少人已经成为 LLM 的 distilled-model?和计算机、网络等技术不同,表征和连续学习的能力真的可以取代人类存在本身,劳动的异化正在以一种前所未有的方式成为现实。

和手机,网络等技术一样,AI 正在逐渐成为我们身体和能力的延伸。当笔者执笔写下这段文字时,已经深深感到自己文笔的生疏,词汇的贫乏,以及思维的迟钝。被日新月异技术裹携着,笔者对未来毫无头绪。唯望笔者能在 AI 洪流之下,仍然做一颗会思考的苇草。