目录

软物质的统计力学(一)

一、引言

二、一个可解模型

本篇:

三、朗之万方程

四、伊藤积分

(暂定计划:

五、Fokker-Planck方程

六、回到平衡态统计

七、平均场近似

八、自由能密度

九、相变与相平衡条件)

三、朗之万方程

上一节我们终于得到了一个随机微分方程——朗之万方程,这一节我们就来详细讨论一下这个方程意味着什么。这里我并不打算从完全严格数学的角度来写(因为我做不到,而且估计写出来也很难看懂),其严格化可以参考Oksendal B,Stochastic Differential Equations(虽然我老板似乎不喜欢这本书)。因此考虑到这一篇覆盖的内容,数学专业的同学可能会感到高度不适。我这里能说的是——这里我们写的所有符号都只是形式的记号,物理学家相信原则上其背后的数学都是可以严格化的,但这里为了符合直觉的物理图像,我们大量采用了这种形式记号——尽管我们没有能力和时间时刻检查其有效性。

首先遇到的第一个困难是上一节所提到的高斯白噪声 \xi(t) 是什么。回想上节中对它的假设,它的均值是0,它是高斯分布,但它的关联函数竟然是狄拉克\delta 函数——也就是说 \langle\xi^2(t)\rangle 是发散的,这根本不可能。这意味着\xi(t)并不是一个严格意义上的随机过程,它本身在数学上是不良定的。

为了修正这个问题,我们先退回原点,再回顾一些历史——早在1822年,布朗就研究了花粉的布朗运动。花粉粒子飘在水中,受到水分子无规则的碰撞会做无规则的运动。后世人们将花粉在某个分量上的运动轨迹 x(t) 抽象为维那过程W_t。维那过程是一个与单参数(时间)有关的随机过程,稍微严格点说,一个概率空间 (\Omega,\mathcal{F},\mathcal{P}) 上的随机变量是一个可逆且保持 \mathcal{F} 代数结构的映射 X(\omega):\Omega\to\mathbb{R}^n ,那么随机过程是参数化的一堆随机变量,即映射X(t,\omega):(\mathbb{R},\Omega)\to\mathbb{R}^n 。当然,实际书写中我们常常省去书写随机过程对 \omega 的依赖,来指代 t 时刻这个随机过程的一个实例。

布朗运动满足的性质也在早期的实验观察中确定了,我们将这几条基本性质作为维那过程的定义:

  1. 布朗运动连续,但没有特定的漂移方向,所以其增量的期望为0,即

\langle W_{t+t_0}-W_{t_0}\rangle=0

2. 同时,布朗运动与历史无关,其不同时间的增量是独立的。即如果 t_1<t_2\leq t_3<t_4 ,那么有

\langle (W_{t_4}-W_{t_3})(W_{t_2}-W_{t_1})\rangle=0

3. 实验中观察到布朗运动的平均位移的平方正比于时间 \langle \Delta x^2(t)\rangle=2Dt 。那么我们定义

\langle (W_{t_0+t}-W_{t_0})^2\rangle=|t|

4. 最后,观察发现布朗运动位移的增量服从高斯(正态)分布。结合上面的性质,有

W_{t_0+t}-W_{t_0}\sim \mathcal{N}(0,\sqrt{t})

这样任意选取一个初始值,我们就完成了一个一维维那过程的定义。

那么这与朗之万方程有什么联系呢?回想上一节的内容,人们之所以引入朗之万方程,最初就是为了描述和解释花粉的布朗运动。如果没有外场作用,水分子处于平衡态,花粉与水分子之间的粘性足够大,使得花粉动量的涨落会迅速被水的阻尼消耗掉,那么两个动力学方程的时间尺度是分离的。在一个更为缓慢流逝的时间尺度下来看,动量几乎是没有变化的, \dot{\bm{p}}=0 ,同样取 2k_BT\mu=1 ,那么我们的动力学方程的形式变得出奇得简单

\frac{dx(t)}{dt}=\xi(t),\ \langle\xi(t)\rangle=0,\ \langle\xi(t)\xi(t')\rangle=\delta(t-t')

也就是说,虽然我们还没给出这个形式方程背后的涵义,但我们在物理上要求这个朗之万方程的解是维那过程 x(t)=W_t 。但是回过头来想,随机过程的微分是什么东西?根据维那过程的性质3, \langle|W_t-W_0|\rangle/t\sim 1/\sqrt{t} ,时间趋于0时根本是不收敛的!当然,这也印证了\xi(t)的发散问题。因此这里不得不再次强调,这个微分方程只是纯粹的形式记号,数学上不能按照导数来理解。

既然形式上有 \xi(t)=dW_t/dt ,那么我们换个写法或许可以让这个方程看起来不那么糟糕。记 dW_t=W_{t+dt}-W_t ,对于普遍的朗之万方程(之后我们用大写的字母来表示随机过程,至于函数记号为什么这么约定我们下一节会看到)

\frac{dX_t}{dt}=f(X_t,t)+\sqrt{2\sigma(X_t,t)}\xi(t),\ \langle\xi(t)\rangle=0,\ \langle\xi(t)\xi(t')\rangle=\delta(t-t')

我们把它写成

dX_t=f(X_t,t)dt+\sqrt{2\sigma(X_t,t)}dW_t

这样看起来似乎好多了,我们首先避免了不合法的导数记号和不可能存在的噪声项,每一项看起来都不发散,似乎迈向了严格化的第一步。但如果读者以为使用微分而非导数可以解决朗之万方程不良定的麻烦,那就太天真了。因为接下来我们面临着一个更大的麻烦。

现实中可以测量的始终是一段时间内物理量的变化,所以其实人们更关心的是微分方程的积分。那么我们仿照一般微积分的做法,现在形式上令

X_t-X_0=\int_0^t f(X_t,t)\, dt+\int_{W_0}^{W_t}\sqrt{2\sigma(X_t,t)}\,dW_t

那么,第一项看起来是个一般的连续函数对某个实参量的积分, 应该没什么问题。但第二项,积分变量竟然不是一个光滑的实函数。如果我们按照黎曼和的定义,取一系列分点 t_i,W_i\equiv W_{t_i}t'\in[t_i,t_{i+1}) ,把积分写成

\int_{W_0}^{W_t}\sqrt{2\sigma(X_t,t)}\, dW_t=\lim_{\max\{t_{i+1}-t_i\}\to 0}\sum_i\sqrt{2\sigma(X_{t_i'},t_i')}(W_{i+1}-W_i)

那么,我们发现因为维那过程的性质3,被积函数有可能不是有界变差函数,这个“黎曼和”不收敛!举个例子,计算

\int_0^t W_s dW_s=\lim_{\Delta s\to0}\sum_{i=1}^N W_{s_i'}\Delta W_{s_i}

如果随机过程取值在区间左端点 s_i'=s_{i-1} (伊藤),那么

\sum_{i=1}^N W_{s_i'}\Delta W_{s_i}=\sum_{i=1}^N W_{s_{i-1}}(W_{s_i}-W_{s_{i-1}})=\sum_{i=1}^N (W_{s_{i-1}}-W_0)(W_{s_i}-W_{s_{i-1}})+\sum_{i=1}^N W_0(W_{s_i}-W_{s_{i-1}}) \\ =\sum_{i=1}^N (W_{s_{i-1}}-W_0)(W_{s_i}-W_{s_{i-1}})+W_0(W_{t}-W_{0})

取均值有

\langle\sum_{i=1}^N W_{s_i'}\Delta W_{s_i}\rangle=\langle W_0(W_{t}-W_{0})\rangle=\frac{1}{2}\langle W_t^2\rangle-\frac{1}{2}\langle W_0^2\rangle-\frac{1}{2}\langle (W_t-W_0)(W_{t}-W_{0})\rangle \\ =\frac{1}{2}\langle W_t^2\rangle-\frac{1}{2}\langle W_0^2\rangle-\frac{t}{2}

但如果取值在中点 W_{s_i'}=(W_{s_{i-1}}+W_{s_i})/2 (Stratonovich),那么类似的计算可以得到

\langle\sum_{i=1}^N W_{s_i'}\Delta W_{s_i}\rangle=\frac{1}{2}\sum_{i=1}^N\langle(W_{s_i}+W_{s_{i-1}})(W_{s_i}-W_{s_{i-1}})\rangle=\frac{1}{2}\sum_{i=1}^N(\langle W_{s_i}^2\rangle-\langle W^2_{s_{i-1}}\rangle) \\ =\frac{1}{2}\langle W_t^2\rangle-\frac{1}{2}\langle W_0^2\rangle

结果差了一个t/2!也就是说,如果不指明积分中函数值的取法,即使是积分形式都是不良定的!

上面展示的例子已经包括了实际中常常采用的两种函数值的取法。那么我们现在终于可以给朗之万方程一个较为严谨的定义了。对于朗之万方程

\frac{dX_t}{dt}=f(X_t,t)+\sqrt{2\sigma(X_t,t)}\xi(t),\ \langle\xi(t)\rangle=0,\ \langle\xi(t)\xi(t')\rangle=\delta(t-t')

我们称它为伊藤-朗之万方程,如果它的形式解是满足X_t=X_0+\int_0^t f(X_t,t)\, dt+\lim_{\max\{t_{i+1}-t_i\}\to 0}\sum_i\sqrt{2\sigma(X_{t_i},t_i)}(W_{i+1}-W_i)

的随机过程 X_t

我们称它为Stratonovich-朗之万方程,如果它的形式解是满足

X_t=X_0+\int_0^t f(X_t,t)\, dt+\lim_{\max\{t_{i+1}-t_i\}\to 0}\sum_i\sqrt{2\sigma\left(\frac{X_{t_{i+1}}+X_{t_i}}{2},\frac{t_{i+1}+t_i}{2}\right)}(W_{i+1}-W_i)

的随机过程 X_t

那么到这里,我们明确,原本的朗之万方程的解并不表示一个唯一的随机过程,在不同解释之下,它实际上表示不同的随机过程,而这个随机过程的(较为严谨的)定义是由上面两式给出的。或者换句话说,同一个随机过程,根据定义的不同,可以用不同的朗之万方程来描述。因此需要再次强调,朗之万方程只是一种形式记号,它的真实涵义是上面给出的“积分”,而其中所有涉及随机变量的“微分”必须要按照相应的积分形式来理解。我们保留并大量使用朗之万方程只是因为方便书写,而且可以和确定性的动力系统对照,从而直接和物理图像联系起来。

那么最后还有一个问题,伊藤积分和Stratonovich积分我们应该用哪个?或者更确切地说,从物理直觉出发建立的朗之万方程,应该用哪个定义更符合真实的物理过程?那么我们先看一下两种积分的特点。

  • 对于伊藤积分,从之前的例子中可以看出来,积分的结果即使在期望的意义下也已经不是一般微积分的那些公式了。另外还可以验证,一般微积分中的链式法则也不再成立 df(X_t)/dt\neq df(X_t)/dX_t\cdot dX_t/dt (提醒:按积分形式理解)。但是,伊藤积分中考虑 X_t=X_{t-dt}+g(X_{t-dt})(W_{t}-W_{t-dt}) ,相当于是在说造成 X_t 扰动的原因和 X_t 无关(或者更不严谨地说, \langle X(t)\xi(t)\rangle=\langle X(t)\rangle\langle\xi(t)\rangle ),即整个过程中“因果律”是得以保持的。
  • 对于Stratonovich积分,在期望的意义下,一般的积分公式似乎仍然可以使用,链式法则也保持成立。但代价是因为考虑到X_t=X_{t-dt}+g((X_{t-dt}+X_{t})/2)(W_{t}-W_{t-dt}),相当于是在说造成 X_t 扰动的原因和 X_t 有关了(或者更不严谨地说, \langle X(t)\xi(t)\rangle\neq\langle X(t)\rangle\langle\xi(t)\rangle ),整个过程并不保持“因果律”。

在统计物理学家看来,因果律(考虑到任何可以写成伊藤积分的随机过程都可以写成一个Stratonovich积分,这里主要是其带来的计算上的便利)远比微积分公式重要,所以通常我们选用伊藤积分。那么,我们接下来就需要修订伊藤积分中的“积分公式”。其中最重要的,就是“链式法则”。

四、伊藤积分

虽然叫做伊藤积分公式,但我们要写的却是一个类似微分“链式法则”的公式,正是因为(再次强调)所有的微分都需要按照相应的积分形式来理解。

那么我们现在考虑一个已知的关于随机变量 X_t 和时间的形式可微函数 g(X_t,t) 。如果我们知道 X_t 满足朗之万方程(今后我们约定所有的高斯白噪声 \xi(t) 的关联都是无系数的, \langle\xi(t)\xi(t')\rangle=\delta(t-t')

\frac{dX_t}{dt}=f(X_t,t)+\sqrt{2\sigma(X_t,t)}\xi(t),\ \langle\xi(t)\rangle=0,\ \langle\xi(t)\xi(t')\rangle=\delta(t-t')

那么 \frac{dg(X_t,t)}{dt} 是什么?

考虑 g(X_t,t) 的一个增量,按照泰勒公式,我们有

dg(X_t,t)=\frac{\partial g(X_t,t)}{\partial t}dt+\frac{\partial g(X_t,t)}{\partial X_t}dX_t+\frac{1}{2}\left(\frac{\partial^2 g(X_t,t)}{\partial t^2}dt^2+2\frac{\partial^2 g(X_t,t)}{\partial X_t\partial t}dtdX_t+\frac{\partial^2 g(X_t,t)}{\partial X_t^2}dX_t^2\right)+\cdots

我们知道 X_t 的增量是

dX_t=f(X_t,t)dt+\sqrt{2\sigma(X_t,t)}dW_t

代入进去整理一下 \begin{align} dg(X_t,t)=&\left(\frac{\partial g}{\partial t}+\frac{\partial g}{\partial X_t}f(X_t,t)\right)dt+\frac{\partial g}{\partial X_t}\sqrt{2\sigma(X_t,t)}dW_t+\frac{1}{2}\left(\left(\frac{\partial^2 g}{\partial t^2}+\frac{\partial^2 g}{\partial X_t^2}f^2(X_t,t)+2\frac{\partial^2 g}{\partial t\partial X_t}f(X_t,t)\right)dt^2\right. \\ & \left.2\left(\frac{\partial^2 g}{\partial X_t^2}f(X_t,t)\sqrt{2\sigma(X_t,t)}+\frac{\partial^2 g}{\partial t\partial X_t}\sqrt{2\sigma(X_t,t)})\right)dtdW_t+2\frac{\partial^2 g}{\partial X_t^2}\sigma dW_t^2\right)+\cdots \end{align}

前两项一次项还没什么需要留意的。因为积分过程中我们会求和,并令时间间隔 dt\to0 ,那么和一般微积分一样, dt^2 项也不重要。那么只需要考察剩下的两项。定义( t_i[0,t] 上的分点, dW_i=W_{t_{i+1}}-W_{t_i}dt_i=t_{i+1}-t_i

Y_t=\sum_i y(X_{t'},t')dW_idt_i

选定分点后这显然是个随机过程,我们可以计算它的均值和各阶距。在伊藤积分下,

\langle Y_t\rangle=\sum_i\langle y(X_i,t_i)dW_i\rangle dt_i

根据上一节末尾提到的伊藤积分的性质(或者说,维那过程增量独立的性质),

\langle Y_t\rangle=\sum_i\langle y(X_i,t_i)\rangle\langle dW_i\rangle dt_i=0

而二阶距

\langle Y^2_t\rangle=\sum_{i,j}\langle y(X_i,t_i)y(X_j,t_j)dW_idW_j\rangle dt_idt_j=\sum_{i,j}\langle y(X_i,t_i)y(X_j,t_j)\rangle\langle dW_idW_j\rangle dt_idt_j

同样因为增量独立,求和 \langle dW_idW_j\rangle 对于i<j和i>j都是0。而 \langle dW_idW_i\rangle=dt_i ,于是二阶距正比于 dt_i^3 ,在 dt\to0 的极限下仍然为0。类似可以得到 Y_t 的各阶距在 dt\to0 的极限下都是0, \lim_{dt\to 0}Y_t=0 所以 dW_tdt 项也可以不用考虑。

最后这一项就比较特殊了。根据维那过程的性质3,直觉上我们有 dW_t^2\sim dt ,它实际上是时间微分的一次项,不能省略。为了证明这一点,我们构造

Z_t=\sum_i Z(X_{t'},t')(dW_i^2-dt_i)

然后和上面类似地计算在伊藤积分下 Z_t 的各阶距。显然 \langle Z_t\rangle=0 。利用暴力展开和 dW_i 服从正态分布 \mathcal{N}(0,\sqrt{dt_i}) ,我们可以验证 \langle(dW_i^2-dt_i)^n\rangle\sim dt^n ,在n>1时求和并取dt\to0为0。因此,\lim_{dt\to 0}Z_t=0。那么,我们对之前的展开式求和并取极限,有

g(X_t,t)=g(X_0,0)+\lim_{dt\to 0}\sum_i\left(\frac{\partial g}{\partial t}+\frac{\partial g}{\partial X_t}f+\frac{\partial^2g}{\partial X_t^2}\sigma\right)dt_i+\lim_{dt\to 0}\sum_i\frac{\partial g}{\partial X_t}\sqrt{2\sigma(X_i,t_i)}dW_t

这相当于是在说g满足的朗之万方程是

\frac{dg}{dt}=\frac{\partial g}{\partial t}+\frac{\partial g}{\partial X_t}\frac{dX_t}{dt}+\sigma\frac{\partial^2 g}{\partial X_t^2}=\frac{\partial g}{\partial t}+\sigma\frac{\partial^2 g}{\partial X_t^2}+\frac{\partial g}{\partial X_t}(f+\sqrt{2\sigma}\xi)

于是乎我们通过增加了一项 \sigma\partial^2g/\partial X_t^2 完成了对链式法则的“修正”。

同样这里可以发现,如果我们取Stratonovich积分,在计算诸如 \langle Y_t\rangle 的时候我们就会遇到麻烦。这里不会去实际计算Stratonovich积分中的链式法则,但只说结论的话,Stratonovich积分的链式法则还是原来的模样。

通过这个“链式法则”,我们可以计算任何涉及维那过程的“微分”了。根据基本朗之万方程 dW_t/dt=\xi(t) ,比如, g(W_t)=W_t^2 ,那么

\frac{d W_t^2}{dt}=\frac{d W_t^2}{dW_t}\xi(t)+\frac{1}{2}\frac{d^2W_t^2}{dW_t^2}=2W_t\xi(t)+1

当然,其涵义依然要在积分意义下理解。

最后提一下N维的朗之万方程。利用独立的维那过程我们可以轻易地推广朗之万方程到多维情形(稍微换了一种写法以适应高维情形)

\frac{d \bm{X_t}}{dt}=\bm{f}(\bm{X}_t,t)+\bm{\sigma}(\bm{X}_t,t)\bm{\xi}(t)

其中 \bm{X}_t\bm{f}\bm{\xi}(t) 是N维向量,且满足 \langle\bm{\xi}(t)\rangle=\bm{0}\langle\xi_\alpha(t)\xi_\beta(t')\rangle=\delta_{\alpha\beta}\delta(t-t')\bm{\sigma}=\{\sigma_{\alpha\beta}\} 是一个NxN维的矩阵。之前的讨论也没什么需要修改的地方。而高维的伊藤积分公式是

\frac{dg(\bm{X}_t,t)}{dt}=\frac{\partial g}{\partial t}+\sum_{\alpha=1}^N\frac{dg}{dX_{\alpha,t}}\frac{dX_{\alpha,t}}{dt}+\frac{1}{2}\sum_{\alpha,\beta,\gamma=1}^N\sigma_{\alpha\gamma}\sigma_{\beta\gamma}\frac{\partial^2 g}{\partial X_{\alpha, t}\partial X_{\beta,t}}

\sum_\gamma\sigma_{\alpha\gamma}\sigma_{\beta\gamma}=(\bm{\sigma\sigma^T})_{\alpha\beta} ,如果你有见到矩阵就对角化的习惯,那么相应的公式可以看起来更加简洁。)

至此我们用不甚严格的方式完成了对朗之万方程的建立。但是实际上回过头想想,这个过程有点奇怪:我们从物理直觉和确定性的动力系统出发,写了一个似是而非的方程,然后花了很大力气去讨论这个方程的不同诠释,以及在伊藤的诠释下方程符合的运算规则。但是,作为一个没有时滞和记忆的马尔可夫随机过程,我们应该可以直接通过随机过程的基本假设出发来写出主方程,描述这套系统所有的动力学,而且这个过程中根本不会产生歧义问题。因此下一节中,我们要明白从朗之万方程诠释出的这一系列东西究竟如何回归到一个马尔可夫过程的主方程中去。

来源:知乎 www.zhihu.com

作者:赵永峰

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载