为什么统计物理中的刘维尔定理 dρ/dt=0 的物理意义是一个代表点邻域内的代表点数目恒定?

我来尝试写一点自己的想法。既然问题中有“从数学上说明”,那我尽量(假装)写得数学一点。

这篇文章的主体内容我以前可能写过,但一时找不到了,这次应该有所改动以及增加新的内容。

(这里我有一些想法,但是全部写下来太多了,总之就是关于“为什么写这篇文章”有一大堆想说的话,但是没什么意义,可能把这篇文章完善以后会重新整理一次)

我大概希望展现的是,知道一点数学之后,从一些基本的想法出发,可以得到一些“看起来说了很多但实际上完全没用的理论”,甚至连“理论”都称不上的东西。

(其实最令我好奇的是问题标签里面为什么有我科大。。)

这个回答的重点:

  1. 当然会有人不理解测度,为什么有测度这个东西出来?我试图给一个“自然”一点的解释。(当然了,也可以说这些都是马后炮)这部分在第二节有解释,以及第五节有另一种解释。
  2. 知道一点最基本辛几何的人都知道,这个定理的“标准”表述其实是“相流保持相空间体积”或者类似的说法,那么这跟统计物理中常见的 \frac{\mathrm d \rho}{\mathrm d t} = 0 是什么关系?我想这部分才是这个问题的重点。这部分在第四节中解释。
  3. 关于导数是什么的问题,当我们写下 \frac{\mathrm d}{\mathrm d t} 或者 \frac{\partial}{\partial t} 的时候,我们真的知道我们在写什么吗?当然了,这不完全算是个物理问题,但总是会有初学者搞不清,我尝试给一个更数学的说明。(然而,初学者看了恐怕会更迷惑)这部分在第三节中解释。

一、什么是系综

我相信不同的人在不同的时候看到“系综”这个词,心里面想到的东西是不一样的。我这里给出一种也许有点意思的想法。

这一节我以前似乎有写过类似的,但是已经忘了写在哪里的了,这里再写一次,应该也比之前的要好一点。

首先假定我有一个力学系统。我会考虑哈密顿力学,所以一个力学系统就是一个 2n 维的辛流形 (M , \omega),称为相空间,和其上一个光滑函数 H,称为哈密顿量。(我只考虑不含时系统)

假设我已经很清楚这个系统也很熟悉哈密顿力学了,那么这里似乎没有什么东西可说的。问题的起始是这样的:如果我考虑有很多个相同的、互不影响的系统,会怎么样?(例如,理想气体这种东西,就可以看成“单个气体粒子”这个系统的许多个拷贝;再比如,太阳系中忽略掉行星之间的引力,就可以看成“太阳产生的有心力场”这个系统的一些个拷贝——你可能会说这不够多,但是在这里,我不需要“多”;更有甚者,我可以自己“想象”一大堆相同的系统——可能会有人说我不懂物理了)

大概不会怎么样,既然它们互不影响,那么大家都是独立的,有什么特别的吗?不管怎样,尝试来研究这一堆系统吧。

第一个方案是“化归法”:我已经会做一个力学系统的问题了,那么我把这一堆系统看成一个力学系统,岂不是就做完了?啊,听起来很有道理,如果有 N 个系统,那么新的大系统的相空间就应该是 M^N,哈密顿量就是 H^N。(这里写得很奇怪,但相信大家都知道哈密顿量是什么,即每个系统独立地有哈密顿量然后全部加起来。作为一个练习,这个相空间上的辛形式是什么?当你回答了这个问题之后,类似地就知道这个哈密顿量应该怎样“严格”地写出来了)

这似乎就是玻尔兹曼统计的样子。看起来好像没什么问题,但实际上有很大的问题:其一,我了解原来的系统,并不代表我了解这个新的系统,虽然理论上应该可以(其实我没有仔细考虑);其二,也是最重要的一个问题,我们会需要考虑 N \to \infty 即热力学极限的情形,这个方案几乎没办法处理。(然而,本文中几乎不会用到热力学极限)

因此有第二个方案,在我看来这是天才的想法,毕竟第一个方案那么自然,怎么会有人另辟蹊径想到这种东西呢?(当然了,你还是可以说我是马后炮)这个方案就是:我仍然只考虑 (M , \omega , H),但我把每个系统的演化都标在这同一个相空间上。可以试着想象一下,在初始时刻每个系统的初始状态都对应这个相空间上的一个点,随着时间的推移,这密密麻麻的一大堆点动起来,形成了密密麻麻的一大把线。、

这就是系综了。(当然,你也可以不同意我的这种看法)

然而,至少目前看来还不知道怎么“数学”地描述这个想法,也就没办法操作了。我会在后面再说这个问题。

二、为什么是测度

好吧,假定我已经有一个系综——不太恰当地说,即一大堆相同的系统——了,我要研究些什么呢?

对于单独一个系统,我们可以问“某个时刻这个系统处于什么状态”;对于多个系统,似乎不应该问“某个时刻这些系统们处于什么状态”(考虑一下,这就回到第一种方案了,因为这等价于把相空间全部乘起来再考虑状态),不过似乎可以问“某个时刻有多少个系统处于这个状态”,这就很“统计”了。

不过这个问题似乎不够好,毕竟我们的系统不是离散的。(道理大概是:如果你产生一万个服从 [0,1] 之间随机分布的随机数,你肯定不会去数“有多少个数等于 0.37”,这个答案除了零几乎不可能有别的;但是大家都会去数“有多少个数大于 0.3 而小于 0.4”,比如数出来1018,这就很让人开心啦)

所以合适的问题类似于:“某时刻有多少个系统的能量在 E_1E_2 之间?”(这个问题很简单,因为能量是守恒量,所以一开始有多少个,以后就永远有多少个)“有多少个粒子的 y 坐标在 y_1y_2 之间?”等等。稍微抽象一点,考虑 M 的任一子集 A,可以问:“某时刻有多少个系统的状态在 A 里面?”

还不够好,因为我们说过,会试图去考虑 N \to \infty 的情况,那么问“有多少个”可能不大合适,但是问“有多大比例”似乎就没有问题了。

好的,随便考虑一个系综,把问题“在 t 时刻有多少比例的系统状态在子集 A \subseteq M 里面”的答案记做 \mu_t(A),并且 t = 0 的特殊情况记为 \mu(A),那么立马能得到一些显然的结论:

  • 显然 0 \leq \mu_t(A) \leq 1\mu_t(\emptyset) = 0\mu_t(M) = 1
  • 如果 A \cap B = \emptyset,则 \mu_t(A \cup B) = \mu_t(A) + \mu_t(B)
  • 如果知道 \mu 了,那么 \mu_t 也应该由系统的演化而完全被确定下来。

前两条几乎是说 \mu_t 是个“概率测度”,不过一来我完全没考虑 \sigma-代数(我觉得没有几个物理学家会想这种事情),二来这也只是有限可加而非可数可加(可数可加总觉得不太物理的样子)。但一定要论证,这些坎也是可以强行过去的;至少“\mu_t 是测度”这件事情应该是可以接受的了。

(我来试着“强行过去”:看一下前面的问题,我们考虑的集合 A 并不是任意的,而是一个可观测量 f 的值在某区间 (a,b) 中的那些态组成的;由于 f 必须连续,故这些 A 一定是开集,所以这个 \sigma-代数考虑 Borel 代数是自然的。至于有限可加还是可数可加,这在物理上似乎没什么影响)

这些个测度究竟“测量”了什么,或者说物理意义是什么?也就是它们的定义,这些系统们的状态的分布。

第三条则是说,系统们的状态在将来的分布,完全被初始时刻的分布给确定下来了。(很显然吧,除非这个系统本身运动状态是不确定的;但是我们有常微分方程解的存在唯一性定理和哈密顿量的光滑性保证)

在后面我会试着给出另一个出现测度的“原因”,也许会显得更自然。

于是我说,这个系综就是这个 \mu,一个系综就是一个概率测度,即初始时刻的状态分布。(这里有些小问题,我放到后面去说;此外,通常的 \rho 和这些 \mu_t 是什么关系,我也放到后面去说)

剩下的问题就是:既然 \mu 决定了 \mu_t,那么这个关系能明确写出来吗?

三、哈密顿力学的复习

我们先简单复习一下哈密顿力学的一些基本内容。

现在已经有一个相空间,即辛流形 (M , \omega),那么最基本也是最重要的一点就是,辛形式 \omega 给出了向量场和 1-形式场之间的同构。这是一个线性代数的事情:有限维向量空间 V 上的双线性形式完全等价于 VV^* 的同构。具体一点写下来,对每个向量场 X,定义 \omega^{\flat}(X)(Y) := \omega(X , Y) 对任意向量场 Y 成立,来确定一个 1-形式场 \omega^{\flat}(X)。显然 \omega^{\flat}(X) = \iota_X \omega,即内积。把 \omega^{\flat} 的逆映射记为 \omega^{\sharp}

于是每个光滑函数 f 都能给出一个向量场 X_f := \omega^{\sharp}(\mathrm d f),这样的向量场称为哈密顿向量场。特别地,我们考虑哈密顿量 H 对应的向量场 X_H,并且认为这个向量场生成的流(单参数微分同胚群 \{\phi_t\})就是这个力学系统随时间的演化。(一个小问题:如果向量场不完备,这只是个局部流;但是似乎没什么人会在意这个事情)

Theorem. 这个流保持辛形式 \omega 不变,因而保持体积形式 \frac{\omega^n}{n!}。换言之,相空间体积随时间演化是不变的。

Proof. 一个量 \alpha 随流的“无穷小变化”就是李导数 L_X \alpha。由 L_X \omega = \mathrm d(\iota_X \omega) + \iota_X(\mathrm d \omega) = \mathrm d(\iota_X \omega),故向量场 X 生成的流保持 \omega 不变当且仅当 \omega^{\flat}(X) = \iota_X \omega 是闭的(这样的向量场称为辛向量场)。显然哈密顿向量场都是辛向量场,因为恰当形式都是闭形式。

(此即通常的刘维尔定理)

如果有一个可观测量,即一个光滑(连续?)函数 f,且系统处于状态 p \in M,那么对这个可观测量做一次观测,得到的结果就是 f(p),这是容易理解的。如果系统初始状态为 p,我们在演化 t 时间后再观测,结果是什么呢?

第一种看法(薛定谔绘景)是:可观测量还是这个 f,但系统的状态在时间演化下变了 p \mapsto \phi_t(p),所以结果是 f(\phi_t(p))

第二种看法(海森堡绘景)是:我假装系统的状态没变,而是可观测量变了 f \mapsto \phi_t^* f,所以结果是 (\phi_t^* f)(p)

当然了,按照定义,它们是相等的。我们可以求出它随着时间的变化,按照李导数的定义,有 \frac{\mathrm d}{\mathrm d t}(f(\phi_t(p))) = (X_H f)(\phi_t(p)) = (L_{X_H} f)(\phi_t(p)) = \frac{\mathrm d}{\mathrm d t}((\phi_t^* f)(p))。然而,按照泊松括号的定义,又有 L_{X_H} f = \{f , H\},因为 \{f , H\} = \omega(X_f , X_H) = (\iota_{X_f} \omega)(X_H) = \mathrm d f(X_H) = L_{X_H} f

所以上面那个式子在物理书上更常见的写法是 \frac{\mathrm d f}{\mathrm d t} = \{f , H\}

现在问:如果可观测量本身是含时的如何?

即,每一时刻 t 都有一个可观测量 f_t,它随着时间的变化也是光滑的。这句话的具体意义是说映射 F : \mathbb R \times M \to \mathbb R , \, F(t , x) = f_t(x) 是光滑的。于是,在 t 时间做一次观测,结果就应该是 f_t(\phi_t(p))

好的,现在来求导,问 \frac{\mathrm d}{\mathrm d t}(f_t(\phi_t(p))) 是多少?注意到

\begin{align*}f_{t+s}(\phi_{t+s}(p)) - f_t(\phi_t(p)) & = f_{t+s}(\phi_{t+s}(p)) - f_{t+s}(\phi_t(p)) + f_{t+s}(\phi_t(p)) - f_t(\phi_t(p)) \\ & = s \cdot (\mathrm d f_{t+s})_{\phi_t(p)}(X_H) + o(s) + f_{t+s}(\phi_t(p)) - f_t(\phi_t(p))\end{align*}

除以 s 并取极限,我们就算得了这个导数。第一项结果显然是 (\mathrm d f_t)_{\phi_t(p)}(X_H) = (L_{X_H} f_t)(\phi_t(p)) = \{f_t , H\}(\phi_t(p)),剩下的则是 \frac{\partial f_t}{\partial t}(\phi_t(p)),而这个 \frac{\partial f_t}{\partial t} 的准确定义应该是 \frac{\partial f_t}{\partial t}(x) := \frac{\partial F}{\partial t}(t , x)

这就是大家所熟悉的等式 \frac{\mathrm d f}{\mathrm d t} = \frac{\partial f}{\partial t} + \{f , H\}

四、其实还是个哈密顿力学的问题

回到原先的问题,即 \mu_t\mu 是什么关系?

显然(也可能不那么显然)有 \mu_t(A) = \mu(\phi_t^{-1}(A)),或者写成 \mu_t(\phi_t(A)) = \mu(A)

\mu_t = (\phi_t)_* \mu,这个的定义如下:如果有可测空间之间的可测映射 f : X \to Y,并且在 X 上还有一个测度 \mu,那么可以用 f 把这个“推前”到 Y 上面去,定义为 (f_* \mu)(A) := \mu(f^{-1}(A))。一个最重要也最常用的例子是,我有一个概率空间 (\Omega , \mu) 和其上的随机变量 X : \Omega \to \mathbb R,那么这个随机变量的“分布”就定义为 X_* \mu,是一个 \mathbb R 上的测度。

好了,那么通常所说的 \rho 是什么?注意到辛流形 (M , \omega) 上本来就有一个体积形式 \frac{\omega^n}{n!},它诱导了一个 Borel 测度 \mathrm{vol}_{\omega}。这个测度具体怎么来的,我下面也会提到。最为一个最好的例子,请回忆,定向的黎曼流形上可以定义体积形式没有问题,但在不可定向的黎曼流形上我们仍然可以定义测度来积分,这个黎曼测度的定义和这里是类似的。

如果我们这个系综的测度 \mu 相对于 \mathrm{vol}_{\omega} 是绝对连续的,则有 \mu = \rho \cdot \mathrm{vol}_{\omega} 对某个函数 \rho 成立,即 \mu(A) = \int_A \rho \, \mathrm d \mathrm{vol}_{\omega},或者写为 \rho = \frac{\mathrm d \mu}{\mathrm d \mathrm{vol}_{\omega}}

假定所有的 \mu_t 性质都很好,那么我们能得到一系列函数 \rho_t := \frac{\mathrm d \mu_t}{\mathrm d \mathrm{vol}_{\omega}}。自然地,我们会觉得 \rho_t 肯定是由 \rho 所确定的,具体如何呢?

按照定义 \mu_t(A) = \int_A \rho_t \, \mathrm d \mathrm{vol}_{\omega},但之前已经知道它也等于 \mu(\phi_t^{-1}(A)) = \int_{\phi_t^{-1}(A)} \rho \, \mathrm d \mathrm{vol}_{\omega}。现在我把 A 选成开集 U,那么这个积分就可以写成微分形式的积分 \int_U \rho_t \frac{\omega^n}{n!} = \int_{\phi_t^{-1}(U)} \rho \frac{\omega^n}{n!}。考虑微分同胚 \phi_t : \phi_t^{-1}(U) \to U,换元积分告诉我们 \int_U \rho_t \frac{\omega^n}{n!} = \int_{\phi_t^{-1}(U)} \phi_t^* \left(\rho_t \frac{\omega^n}{n!}\right)。于是,在任意开集 V 上两个体积形式 \rho \frac{\omega^n}{n!}\phi_t^* \left(\rho_t \frac{\omega^n}{n!}\right) 的积分是相同的,故它们只能相同。

前面的刘维尔定理告诉我们 \phi_t^* \left(\frac{\omega^n}{n!}\right) = \frac{\omega^n}{n!},所以最终的结论是 \phi_t^* \rho_t = \rho,即 \rho_t(\phi_t(p)) = \rho(p)

如果强行把 \rho_t 看成可观测量——虽然它们确实是函数,但是从物理意义上来看,把它视为含时的可观测量是非常不恰当的,但如果我们坚持这样做——就能发现 \frac{\mathrm d}{\mathrm d t}(\rho_t(\phi_t(p))) = 0,因为它就是常数,跟时间压根没关系。

回想一下前面哈密顿力学的讨论,这里应该写成 \frac{\mathrm d \rho}{\mathrm d t} = \frac{\partial \rho}{\partial t} + \{\rho , H\} = 0。这就是通常看到的刘维尔定理。

好吧,倒回来看物理意义,按定义 \rho(p) 就是初始时刻 p 点附近状态数目的概率密度,即此点附近的“代表点密度”,而 \rho_t(\phi_t(p)) 就是 t 时刻 \phi_t(p) 点附近状态数目的概率密度。它们相等,意味着随着时间变化 p 跑到了 \phi_t(p),但“代表点密度”其实是没有变化的。这就是我对本问题的回答。

再想一想,写成 \frac{\partial \rho}{\partial t} + \{\rho , H\} = 0 似乎不太好,因为这单独的两项——如果按照我们之前那样把它们仔细明确地写出来——似乎都没什么物理意义。(这也是我说的 \rho 从物理上来看不是一个可观测量)

五、再说测度

我试着说一种另外的想法,大概能更自然地导出测度,只不过不够直观。

我现在有一个系综,即很多个完全相同但互不影响的系统,各自处于各自的状态。对于任一可观测量 f,一个自然的问题是:这些系统都对 f 做观测,得到的结果平均是多少?(最常见的问题,比如平均能量多少)毕竟,考虑单个系统没什么意义了,要观测就全部观测,看一看平均值。

那么得到一个映射,把可观测量 f 映到它在这个系综下的平均值 \langle f \rangle,并且显然这个映射有以下性质:

  • 如果 f \geq 0 是非负的,那么显然 \langle f \rangle \geq 0
  • 考虑可观测量 \mathbf 1,即每个状态观测一下都得到 1 的这么一个可观测量,或者说映到 1 的常值函数,显然 \langle \mathbf 1 \rangle = 1

那么由第一条,里兹表示定理(不是希尔伯特空间里面的那个)告诉我们,在相空间 M 上存在唯一的 Borel 测度 \mu,使得 \langle f \rangle = \int_M f \, \mathrm d \mu,并且第二条告诉我们 \mu 还是一个概率测度,即 \int_M \mathrm d \mu = 1

(你会发现我这里不是很严格,比如我根本就没说流形是不是紧的或者我的可观测量要不要紧支集什么的,然而,我觉得这些事情在这里并不那么重要)

这种想法更快速更自然,但也不那么直观,因为最不平凡的事情隐藏在这个大定理(正线性泛函等价于测度)里面了。之前的想法明显要直观得多,就是最基本的想法导出最基本的定义。

你可以考虑一个例子,就是这个系综里面只有一个系统的情况。此时的正线性泛函就是 f \mapsto f(p),对应的测度也就是这一点处的狄拉克测度 \delta_p,即 \delta_p(A) = 1 当且仅当 p \in A,而 \delta_p(A) = 0 当且仅当 p \notin A 这样的一个测度。

六、量子的情况

我并不打算说量子统计(我也不会),只是试着把上面的想法放到量子力学上。

自然地,相空间就从一个辛流形变成了一个希尔伯特空间 \mathcal H,哈密顿量还是哈密顿量,但不再是函数而是线性算子了。(我会忽略掉无界算子这方面的事情, 一来太过复杂,二来我们可以假装只考虑有限维的希尔伯特空间:有限维希尔伯特空间在希尔伯特空间中的地位大概就像紧流形在流形中的地位,有限维希尔伯特空间上的线性算子都是有界算子,紧流形上的连续函数都是有界函数)

系统的一个状态也就是一个向量,或者更准确地说是这个向量对应的一维子空间。时间的演化也就是 H 生成的单参数酉群 \exp(-\mathrm i t H) 给出的。一个系综是什么呢,按照之前的想法,也就是在相空间上找很多个态。

所有的可观测量构成一个 C*-代数,跟上面一样的,一个系综给出可观测量的平均值,这还是一个正线性泛函,并且把 \mathbf 1 映到 1 ,所以是这个 C*-代数的一个态(state)。所以 GNS 构造会出现了。

这部分没写完,我也不打算继续写了,有些地方还没想通,明天要开始学习了,估计很长一段时间不会来想。基本上可以考虑的有:

  • 上面的 GNS 构造告诉我们什么呢?类比于经典的情况,应该个类似于测度的东西。
  • 如果找到了这个东西,有什么更直观的理解吗?
  • 密度矩阵是如何出现的?跟经典的类比,它的地位跟前面的密度函数是类似的。
  • 不要只考虑有限维,无限维的时候(有无界算子出现的时候)如何?可能这个时候才有真正有趣的东西出现。

我可能大概知道前两个问题的答案,但还不能非常清楚地说出来。一方面我没有花多少时间去考虑,另一方面某些知识自己也不那么清楚,留一个问题以后去想吧。

来源:知乎 www.zhihu.com

作者:张智浩

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 8 个回答,查看全部。
延伸阅读:
既然有大型粒子加速器,小型的有什么用?
现在的光学在生物医学方面的最前沿的研究与应用有哪些?