2.(量子力学入门)能量量子化，普朗克常数的推导

物体辐射量的测量

冰岛物理学家廷德尔（John Tyndall）从事过一些土地测量和铁路建设工作，之后成为数学和测量教师.在学校和一个同事成为朋友后，两人决定去德国继续他们在科学上的学习，在德国，本生是Tyndall的老师.1701年牛顿通过实验，给出了一个冷却过程中温度与时间的关系定律，但是牛顿没有使用任何数学公式，由于文章很短，也没有数据支持，这对后续的研究者影响很大，后面继续有人研究这个问题，一直到Tyndall，他前面的研究者Dulong 和Petit的实验中温度范围太小，而且没有使用绝对温度.与此相反，Tyndall测量的温度高达1200℃，他精确地测量了金箔线通电后的辐射.

一螺旋的金线用球形玻璃封闭以避免空气流动，玻璃球上有一个孔能够将螺旋线上发出的光射到热电（由热生电）电池上，……金线从黑色低温状态被逐步加温到完全的白热，这样，使金线从最初的黑色状态变到白热所增加的电流，使暗淡的辐射增加440倍.

Joseph Stefan是澳大利亚物理学家，1879年，从Tyndall和Dulong，Petit的实验测量，Stefan提出一个有名的经验关系式，这个关系式声称一个物体单位时间辐射出的总能量与物体绝对温度的四次方成正比.但是Stefan对Dulong和Petit的公式不太满意，在研究了他们的实验的细节后，Stefan注意到，由于与周围的bulb有传导而损失了热量.在修正后，他给出了公式

$H = A{T^4}$

然而，Dulong和Petit使用的温度很低，测试这个公式需要更高温度，此时Stefan看到了Tyndall的高达1200℃的大范围的实验数据，且与公式完全符合.

从微红的大约525℃到完全的白热的大约1200℃，辐射从10.4增加到122，大约12倍（11.7），这使我考虑到热辐射与绝对温度的四次方成比例.绝对温度从273+1200 到273+525的比是1.849，1.849的四次方是11.6，与122/10.4=11.7十分接近.

Stefan的发现十分走运，因为Tyndall的实验数据是错误的，Tyndall不是测试一个近似的黑体. Tyndall应该得到的数据是18.6而不是11.7，他的错误的测量数据恰好与黑体辐射的数据相近.

Stefan的公式没有被科学界立即接受，直到他的学生玻尔兹曼（Ludwig Boltzmann）于1884年做出一个理论性的推导.这个推导需要用到Bartoli的辐射压（radiation pressure）.

辐射压

开普勒于1619年提出用辐射压的概念解释彗星的尾巴一直指向远离太阳一侧的观测事实.麦克斯韦于1862年提出光是电磁波，具有动量，因此施加压力于暴露在光照下的任何表面上.

Bartoli是意大利物理学家，1874年麦克斯韦发现以太有tension，换句话说，就是有辐射压.1876年，Bartoli从热力学角度推导出辐射压的存在，他论述说，由于物体的辐射温度会由于光线通过镜子反射而升高，因此从低温物体传递能量到高温物体是可能的，为了避免与热力学第二定律矛盾，光对镜子有作用力是必须的，之后radiation pressure在爱因斯坦的质能方程和光电效应中有重要作用，当爱因斯坦1895年生活在Pavia时，Bartoli正好是当地大学的物理学教师.Bartoli是通过分析crookes的实验（crookes阴极射线管），基于自己设想的thought experiment来研究这个问题的，我们来详述Bartoli的实验.

Bartoli想象有一个圆柱体被可以移动的、完全反射的活塞A，B分为3个空腔（想象为真空中），活塞被完全封住但是可以无摩擦地滑动，每一个活塞中间有一个带有阀门的孔，阀门可以无摩擦地打开使得相邻空腔之间可以连通.圆柱左右两头用黑体封闭且处于不同温度， ${T_1} < {T_2}$ .

活塞A最初靠近圆柱体左边且阀门打开，活塞B最初靠近圆柱右边且阀门关闭.这样，两个活塞之间充入辐射radiation，且能量密度与黑体温度一致达到T1，Bartoli于是假定如下循环：

1. 关闭活塞A的孔，使与温度为T1的黑体处于平衡态的辐射封闭在两个活塞之间.然后将活塞A向活塞B移动直到两活塞之间的辐射能量密度radiation energy density增加到与右边黑体温度相同，然后打开活塞B的孔.（圆柱内充满辐射，比如light，光在圆柱内壁、活塞表面来回反射，随着活塞的运动，空腔体积减小，单位表面积和单位体积内的辐射增加，温度升高）

2. 将活塞A向右移动直到与B接触，然后继续一起移动这两个活塞，直到活塞B与圆柱右端黑体接触，这使得活塞A、B间的辐射进入温度为T2的黑体.

3. 关闭B上的孔同时打开A上的孔使两个活塞回复到最初的位置，这就完成了一个循环.

很明显，这个循环的结果是将热从低温容器传递到了高温容器，然而热力学第二定律表明外界不做功的情况下，热不可能从低温物体转移到高温物体，因此，我们推论，在这次循环中做了一定量的功.但是由于活塞和阀门都是无摩擦的，功只可能是反抗辐射压做的against radiation pressure.

很偶然地， Bartoli的结果被玻尔兹曼知道了.玻尔兹曼是奥地利物理学家，是热力学和统计物理学的奠基人之一.1866年在维也纳大学时，在Stefan的指导下写了一篇论文a thesis on the kinetic theory of gases而获得博士学位，之后成为Stefan的助手，之后再由Stefan的推荐，成为某校教授.

玻尔兹曼在分析了Bartoli 的结果后，得到辐射压

$p = \frac{1}{3}u$

u表示辐射能量密度.再利用基本热力学关系

${\text{dU = TdS}} - {\text{pdV}}$

以及辐射能量密度

$u = \frac{U}{V}$

得到了Stefan根据实验所得的公式（具体参考wikipedia），Bartoli和Boltzmann将电磁学和热力学结合起来处理热辐射的想法被维恩Wien使用.Wien的推导过程使用了多普勒效应，我们先来认识多普勒效应.

多普勒效应

Stars are suns，距离地球遥远的星星是一些类似太阳的发光发热的恒星，它们在宇宙中高速运动.但为什么有些星星是橘黄色的orange，其它一些又是红色或蓝色的？这种颜色的不同在特定联星中尤其突出.联星是指两颗星，它们绕由其组成的系统的质心运动.1842年，澳大利亚天文学和数学家，Prague大学教授多普勒Doppler觉得他找到了一种解释.

根据多普勒的解释，光是一种波动现象，我们看到的光的颜色是由光的频率决定的.这个频率依赖于光源和观察者之间的相对运动速度.如果光源和观察者相互靠近，每秒钟达到观察者的光波就更多，观察到的频率就会更高，所以光的颜色将会变得更绿.如果观察者和光源之间的距离不停地增加，观察到的频率就会减小，观察者就会看到更红的颜色.

1842年5月25日，Doppler在Prague大学进行了一场演讲，在演讲中解释了他的如上理论，一年后，这个理论被发表.多普勒还提到，同样的效应在声波中也应该可以被观察到.多普勒效应在声波上于1845年被Ballot验证，但是不能用来解释恒星颜色的不同，因为颜色的不同是由于不同表面温度造成的.联星的颜色不同主要是由于相互之间的对比、差异造成的.然而多普勒效应在现代天文学中依然十分重要.天体的旋转和运动可以通过它们发出的光的微小变化计算出来.

维恩位移定律

德国物理学家维恩（Wilhelm Carl Werner Otto Fritz Franz Wien，1864年－1928年）1864年1月13日出生在东普鲁士（现俄罗斯）的菲施豪森（Fischhausen），他的父亲卡尔•维恩（Carl Wien）是地主.1879年在拉斯滕堡（Rastenburg）、1880年至1882年在海德堡读中学.中学毕业后，1882年在哥廷根大学学习数学，同年转去柏林大学（德国当时学生有到不同学校学习的惯例）.1883年至1885年在亥姆霍兹的实验室工作，1886年获得博士学位，论文题目是光对金属的衍射（他的导师就是研究这方面的），以及不同材料对折射光颜色的影响.此后，由于维恩的父亲生病，维恩不得不回去帮助管理他父亲的土地（维恩和他父亲一样性格内向）.期间他有一个学期跟随亥姆霍兹，1887年完成了金属对光和热辐射的导磁性实验.

在国家物理工程研究所，维恩与路德维希•霍尔伯恩（Ludwig Holborn）一起研究用勒沙特列（Le Chatelier）温度计测量高温的方法，同时对热动力学进行理论研究，尤其是热辐射的定律.1893年，维恩提出波长随温度改变的定律，后来被称为维恩位移定律.

黑体的辐射是由一个波长范围的辐射组成的，基尔霍夫已经给出黑体辐射是频率和温度两个变量的函数，所以当温度一定时，我们就可以测量辐射能量与频率的关系，借助光谱分析，我们可以测量频率与辐射的关系.将辐射集中在分光计的狭缝使其分散为光谱（this cannot be done with a prism of ordinary glass which absorbs strongly above some 2μm，但是可以用rock salt prism）.可以通过放置热电偶在不同波长的位置来研究.在光谱的任意一点上，热电偶接头截取到波长范围为λ到λ+△λ内的能量，这个能量除以△λ，商就是单位波长的能量.如果我们测量发射的能量与发射面积的比值，我们就可以得到单位波长范围的辐射出射度 ${M_\lambda }$ .

19世纪末期时像这样的测量已经做完了，产生了类似下图的曲线图：

横坐标表示波长，纵坐标表示能量密度(复制于Wien 1894年发表的论文中，说明Wien曾经做过这个实验).

Wien的想法是使用一个有一个小洞的像烤炉一样的物体近似模拟黑体，通过小洞进入黑体的辐射经过内壁的散射和反射，从而几乎所有进入火炉的辐射都被吸收了，那些找到路径再次射出烤炉的辐射会非常少，于是从小洞出来的辐射就非常接近黑体达到平衡状态时与其温度对应的电磁辐射.（这种模型基尔霍夫曾经给出过.）

Wien发现，温度不变时，单位波长范围dλ的辐射能量dW在某一特定波长 $\lambda_{m}$ 处有一个最大值，随着温度的增加，这个最大值所处的波长 $\lambda_{m}$ 向短波方向移动，他发现 $\lambda_{m}T$ 是一个常量， $\lambda_{m}T$ =0.2898 centimetre-degree Kelvin.

温度增加时辐射能量的最大值向更高频率移动的Wien位移定律以量的形式表达了我们平常观察到的情况.我们的皮肤感觉温暖的物体会产生红外辐射；温度接近T=950 K会观察到昏暗的红光；温度增加时，光的颜色会增强，变成橘黄色和黄色.钨丝灯的温度是T=2500 K，会发出白光，但是根据Wien的定律，此时光谱的最大值依然是红外的，当温度达到T=6000 K时，光谱的最大值移向可见的黄色，就像太阳表面的颜色一样.

Wien的定律只是一个通过实验得到的经验公式而不是理论推导得到的.1894年，Wien通过一个思想实验thought experiment进行了理论推导.

Wien研究了由两个过程导致的辐射能量密度的增加：温度的增加和绝热情况下含有辐射的密闭体积的减小.如果这两个过程最终都达到相同的温度，那么both process should lead to the same energy distribution among the wavelengths.在考虑了多普勒效应后，他达到了这个目标.

想象一个装有黑体辐射的圆柱体被一个能够完全反射辐射的可移动的活塞封闭，移动活塞，我们可以缓慢地减小圆柱体空腔的体积，从而这种压缩过程是绝热的，也就是说，平衡态始终被保持着，被活塞反射的辐射的频率将根据多普勒效应而变化，因此由于活塞的运动做功，这个封闭空间内的温度将上升，定量的变化过程使得Wien得到了Wien位移定律.

普朗克与黑体辐射

Wien最终得到一个黑体辐射公式，很快，Lummer和Pringsheim就通过实验证实了Wien和Stefan-Boltzmann的结果，但是只有高频部分符合.Planck以不可逆的过程重新导出了Wien的公式，planck的基本思想是将辐射场看作是谐振子的集合，这些谐振子与空腔壁交换能量.

Wien和Planck是同事，普朗克在黑体辐射上的兴趣很有可能是被Wien的文章激发起来的.

很幸运地，普朗克继承了基尔霍夫在柏林大学的理论物理学教授职位，普朗克在学校时，他的教师包括基尔霍夫，赫姆赫兹等，普朗克最初的科学研究是一个普通的主题，热力学第二定律，尤其是熵的概念及其在物理和化学平衡问题中的应用，比如phase transitions and electrolytic dissociation.他非常仔细地work out他的理论的细节并计算出可以立即与可用实验相比较的结果.另一方面，他倾注了极大地热情来给出基本概念的清晰定义.在深深地受到克劳修斯clausius的手稿的影响下，他尤其想在热力学中建立熵的增加原理，就像能量守恒定律在热力学中的地位一样.在这些努力中，他曾经指出了一条非常重要的规则，不可逆过程.比如，在自然过程中，比如热的传导过程是不能完全可逆的.与此同时普朗克进入到热辐射领域.

普朗克进入热辐射领域的原因

Wien的分析具有很强的热力学喜好，而普朗克正是热力学方面的高手，因而Wien可能会求助于普朗克.此外，由于赫兹在电磁波实验上的成功，当时很多科学家对电磁波现象都很感兴趣.还有一个原因是Planck很关心热力学在电磁学领域的使用.比如，Planck在1894年6月28日到普鲁士科学院的就职演说中说，我们可以获得电动过程的很closer的理解，这个过程直接由温度的作用产生，尤其是热辐射的作用，而不必沿着艰苦的电的力学解释路线.（这里可能指热电转换），最终，Planck有机会参与了他的柏林同事，比如Wien，Rubens的大量的关于热辐射的讨论.在开始理论分析之前，普朗克知道探寻黑体辐射特性的详细的实验已经做出来了.

“Lummer和Pringsheim通过测量来研究热辐射的光谱，而我的注意力是基尔霍夫的理论，一个内壁完全反射辐射的空腔里含有形状、材质和温度都不定的吸收和发射热辐射的bodies，经过一段时间后回到一个状态，在这个状态中，所有bodies呈现相同的温度，空腔内所有辐射的特性，甚至是它们的光谱能量分布，都不依赖于这些bodies的材质和结构，而只依赖于它们的温度，这就是空腔内获得的辐射的平均能量分布，因此，呈现出一种绝对的量，因为寻求这种绝对的量对我来说是最漂亮的研究任务，所以我急切地开始处理它.Planck,1948a,pp.23-24”

普朗克知道Wien的定律公式，那个公式与观察相当地吻合.然而，尽管Wien使用了热力学的arguments来推导，但是Planck对其不是完全地满意.普朗克希望用一个更系统的方法实现一个相同或相似的等式.

麦克斯韦的电动力学和结果是清楚的，比如，1890s在柏林大学有大量关于它的课，Wien在1892年夏季和冬季的课，Weinstein还将麦克斯韦的论文翻译成德文，以及Rubens的实验基础课.普朗克还有规律地在柏林大学学习了电和磁理论，值得一提的是，普朗克关于赫兹的回忆录中，强调了赫兹的role在麦克斯韦理论和电磁波的发展中的作用.

普朗克于1895年3月21日在普鲁士科学院的会议上呈交了他的第一篇关于电磁辐射的论文.在论文中他研究了作为辐射源radiation的具有相同特征频率的带电系统吸收和发射辐射的过程，他将这些系统称为resonator.在接下来的几年里他继续研究这些共振系统.包括，比如辐射产生的阻尼效应的处理.他是这样解释他的目的的：

The study of conservative damping[i.e.. of radiation damping,which planck called “conservative”,because it did not violate energy conservation] appears to me to be of fundamental importance due to the fact that through it one’s view is opened towards the possibility of a general explanation of irreversible processes with the help of conservative forces –a problem which confronts the theoretical research in physics more urgently every day.

通过这个紧迫的问题，普朗克涉及到一个问题，那就是热力学概念熵是否可以用一种合理的方法定义而不是用力学或电动学.玻尔兹曼用气体动力学给出了熵的一种表达，但是1896年Planck的助手建议说玻尔兹曼的结果是错误的，根据Poincare的力学理论，气体分子的守恒系统经过一段时间后始终会回归最初的状态.因此，熵的力学定义暗示了一个系统随着时间的发展将趋于玻尔兹曼认为的那种可能的状态是不可能的.…总之普朗克对玻尔兹曼对熵的定义很不喜欢.

普朗克在他的第一篇论文中提及，‘第二个conductor特征周期几乎与原波的周期相同’，因此会因为共振而开始电磁振荡，彼此的周期相差越小，振荡就越大.也就是说，在普朗克的脑海里有包含了第一级和第二级传导系统的赫兹的实验设备(参考赫兹验证麦克斯韦电磁理论的实验设备).赫兹用这个实验设备来计算电磁波的传播.也就是说，电磁波在第一级系统中产生，然后在第二级系统中被发现.在之后的论文中赫兹也给出了他的系统的理论；赫兹用长度为l的导体做第一和第二级系统，在导体中，带电量为e的电做简谐振动，赫兹还研究了由第一级系统产生的电磁波的特征，以及这个电磁波被第二级系统吸收和再次发射.普朗克引用了赫兹的这些结果来建立他的通过共振产生的电磁波的吸收和发射理论.

应该注意到普朗克之后为他的第一级系统同时使用了resonator和oscillator，它们吸收和发射电磁辐射.

组成物体的振动粒子有责任are responsible for吸收和辐射电磁波的想法被强调，尤其是洛伦兹.在洛伦兹的书中处理了运动物体的光和电现象，在其中洛伦兹给出了这个想法，lorentz also drew attention to the fact that his formulae for the components of the electric and magnetic fields emitted by the oscillating ions agreed with the expressions by which hertz has described the oscillations in the neighborhood of his vibrator.这样，到19世纪末，普朗克使用了洛伦兹的molecular oscillators以及他的elementary resonators.

普朗克议论说，基于力学理论的严格的摩擦的理论只有借助于附加的假设才能实现.与玻尔兹曼在气体中的理论不同，普朗克希望他可以证明空腔中的不可逆过程是成立的（不需要参考概率假设）.例如，由完全反射的空腔壁组成的空腔中充满热辐射以及一个赫兹的resonator，这个振子会吸收和发射辐射.特别地，普朗克说：这样一个振子会由于吸收了外界outside射向它的辐射而激发，又因为发射辐射而被阻尼，现在它发射的辐射一般来说与吸收的辐射不具有相同的能量分布，因此这个振子将通过它的振动改变经过它的周围的电磁波的特性，比如会同化射入的辐射的温度.

在递交给普鲁士科学院的5份报告中，普朗克试图证明他的上述说明.这些研究的结果是Wien的黑体辐射分布定律.

1895年普朗克发表了自从进入黑体辐射问题以来第一篇文章，是关于平面电磁波被简谐偶极子共振散射resonant scattering of plan electromagnetic waves by an oscillating dipole.普朗克认为这是他朝着处理黑体辐射迈出的第一步.他的目的是建立起一个在封闭空腔中的振子系统，振子可以产生辐射并与空腔壁反射回来的辐射相互作用，从而一段时间后达到平衡态.然后可以运用热力学定律与黑体辐射来理解黑体辐射光谱.当振子通过辐射损失能量后，因为辐射被封闭在一个内壁可以反射的盒子里，所以振子损失能量的过程是守恒的，因为这些能量会被反射回来作用于振子上.

插入熵的概念

1850年，克劳修斯发表了第一篇关于热的理论的论文——《论热的动力以及由此推出关于热本身的定律》.在论文里，他首先以当时焦耳用实验方法所确立的热功当量为基础，第一次明确提出了热力学第一定律：在一切由热产生功的情况中，必有和所产生的功成正比的热量被消耗掉；反之，消耗同样数量的功，也就会产生同样数量的热.按照这个基本定律，克劳修斯又以理想气体为例，进行进一步的论述，否定了热质理论的基本前提，即宇宙中的热量守恒，物质内部的热量是物质状态函数的观点.

在热力学第一定律的基础上，克劳修斯接着在论文的第二部分，重新论证了卡诺于1824年得出的“卡诺定律”——工作于两个温度间的一切理想热机，有同样多的热量转移而得到同样多的功，且与工作物质无关，在这个循环过程中热量并未消失.克劳修斯经过精密的论证后认为，卡诺定理的基本内容是正确的，但热量的没有消失显然和热功当量相矛盾，因此卡诺在论证过程中所依托的“热质守恒”是不可信的.克劳修斯指出，根据我们的日常经验，要使热从低温物体传向高温物体，必须要消耗某种动力或者有其他的一些变化.在没有任何形式变化的情况下，热必定是从高温物体向低温物体转移.这一著名的论断就是热力学第二定律的基本内容.

热机是工作在两个不同储热器之间的理想机器，它从温度为t1的储热器获取热量做功，再将余热排到温度为t2的较低温储热器.

卡诺热机的效率

$\eta = \frac{W}{{{Q_H}}} = \frac{{{Q_H} - {Q_C}}}{{{Q_H}}}$

对于理想热机的卡诺循环，效率也可写为

$\eta = \frac{{{T_H} - {T_C}}}{{{T_H}}}$

从而

$\eqalign{ & 1 - \frac{{{Q_C}}}{{{Q_H}}} = 1 - \frac{{{T_C}}}{{{T_H}}}, \cr & \frac{{{T_H}}}{{{Q_H}}} = \frac{{{T_C}}}{{{Q_C}}},or\frac{{{T_H}}}{{{Q_H}}} - \frac{{{T_C}}}{{{Q_C}}} = 0 \cr}$

注意，是从温度为T1的reservoir流出温度为T1、热量为 ${Q_H}$ 的热，流出这部分热之后，原来的reservoir温度依然是T1，只是热量减少了.同理，温度为T2的低温reservoir里，流入温度为T2的热量，总热量增加，但是温度不变.

理想的卡诺循环是可逆循环，但是对于现实中不可逆循环，克劳修斯给出了一个例子，如果10 J的热量从350 K的物体流到300 K的较冷物体，注意，此情况不是热机，只是自然界中温度从高温物体传递到低温物体，则有

$\frac{Q}{{{T_H}}} < \frac{Q}{{{T_C}}},or\frac{{10}}{{350}} < \frac{{10}}{{301}}$

为了进一步推动热的动力学说，克劳修斯把理论和实验结合起来，进行深入的研究.在研究卡诺热机操作循环过程中，他发现热量在减少的同时，却可以看出有一个量在整个循环的过程中自始至终保持不变.如果是在理想过程中的话，那么这个比值是个常数，而且从不会减少.这也就是说，在密闭系统中，系统的热量和系统的绝对温度的比值在任何过程中都是不变的.这个不小的发现使克劳修斯惊喜不已，他隐约感觉到自己的研究又将出现新的突破.于是，他不断地实验，反复地论证，把所有的精力都倾注在这个“恒量”的研究之中.1854年，克劳修斯把研究的结果以论文的形式予以发表，在文中，他提出了著名的“克劳修斯不等式”，得出了卡诺热机效率的公式，并推广到任何一个可逆的循环之中.1865年，克劳修斯发表了《力学的热理论的主要方程之便于应用的形式》一文，在文中明确表达了“熵”的概念.熵是物质的状态函数，即状态一定时，物质的熵值也一定.

使用熵这个新概念，Clausius可以将热力学第二定律的热始终\只能从高温物体流向低温物体表示成数学形式.正如我们一直观察到的，如果一定量的热Q自然地（非外界作用）从一个高温物体流到低温物体，低温物体获得的熵要比高温物体失去的熵大，所以他可以称述说，任何热的传递效果，也就是驱动所有自然界的热力学的过程的原理，是参与热传递的两个物体之间的熵的增加.这个新的原理确定了自然的过程的前进方向.所有的自然过程都是以熵的增加的形式发生的.只有两个物体的温度相同时，热的传递过程中熵不变，而这是不可能的，因为此时不会有热的传递.所以绝热等温的热传递过程会导致熵不变，这只是一个理想状况，因此不会发生.所有其它真实的过程，都有熵增加的效应.这就是热力学第二定律.

热力学第二定律可以用很多不同的描述来总结，所有这些描述都是对我们所观察到的事情给以一个合理理由的尝试.当两个物体有热接触时，热总是从温暖的物体传递到比较冷的物体.这个普遍适用的结果很可能有很多物理学家给出很多的解释了，但是困难不在于第二定律说的是什么，而是为什么自然界要这样进行，最根本的原因是什么.

任何进程要么增加熵，要么保持熵的恒定.熵的恒定只在可逆的平衡过程中发生.所有自然的过程都是不可逆的.

气体分子运动论

我们知道，气体是由一个个分子组成的.那么，由千百万个分子组成的气体，其宏观性质自然也应该与每一个微观分子的运动息息相关.但是很显然，由于分子数量太大，用牛顿力学来解释系统内每一个分子的运动，实际上是不可能的.为了建立气体分子的微观运动与宏观现象之间的理论联系，从19世纪中叶开始，人们逐渐建立了一门新的学科——气体分子运动论.

气体分子运动论认为，气体中的大量分子处在混乱的运动之中.而整个体系所表现出来的宏观性质，可以根据力学定律以及大量分子运动所表现出来的统计规律来说明.例如，气体的压强是由大量分子撞击容器的器壁而产生的，气体温度的升高是分子平均动能增加的结果.

现在看来，上面这些东西似乎都很简单，我们在中学物理课本上就已经对它们很熟悉了.可是当分子运动论在19世纪中叶刚刚出现的时候，它却引起了一场轩然大波.玻尔兹曼就是这场风波的主角之一，并为此付出了生命的代价.

玻尔兹曼熵公式

1863年，玻尔兹曼进入著名的维也纳大学学习物理学和数学专业.大学毕业后，他继续攻读博士学位.1866年2月6日，不满22岁的玻尔兹曼完成了他的博士论文《力学在热力学第二定律中的地位和作用》.在论文中，他试图利用分子运动和相互碰撞来阐述热力学第二定律，但并没有得到满意的结果.

1866年，著名物理学家麦克斯韦连续发表了两篇关于气体分子运动论方面的论文，首次引入了统计学思想，并计算出了分子速度的麦克斯韦分布律.玻尔兹曼受其启发，也转向研究分子运动论.经过两年的研究，1868年，他在《关于运动质点活力平衡研究》一文中，推广了麦克斯韦的结果，证明了在有势的力场中处于热平衡的分子运动速度分布律，即现在所称的麦克斯韦——玻尔兹曼分布律.由于这一成果，玻尔兹曼获得了在大学任教的资格.1869年，他受聘于奥地利的格拉茨大学，继任著名物理学家、哲学家马赫的数学物理学讲师职位.

1872年，玻尔兹曼对气体从不平衡过渡到平衡的过程进行了研究，导出了著名的玻尔兹曼方程.1877年，玻尔兹曼又发表了“第二定律与机械热理论的关系以及热平衡定律的概率计算”这一长篇论文，建立了热力学第二定律与概率论规律之间的直接联系，这就是玻尔兹曼熵公式.

要解释玻尔兹曼熵公式，先复习一下熵的概念.熵在希腊语中是“变化”的意思，它是1854年由德国科学家克劳修斯首先引进到物理学中的，用来说明热力学过程的不可逆性.克劳修斯是从宏观热力学角度来研究熵的.所谓“宏观”，也就是说，我们是用温度、热量、体积、压强等宏观物理量来描述所研究的体系.克劳修斯把熵同系统的热量交换联系在了一起，系统熵的变化就等于热量变化除以绝对温度后所得的商.

我们大家都知道热力学第二定律：在没有外界做功的情况下，热永远不能由冷的物体传向热的物体.利用熵的概念，我们可以把热力学第二定律表示成更简洁的说法：在孤立系统中，熵总是不断趋于增大.

那么，从微观角度看，熵又代表了什么呢？玻尔兹曼给出了他的答案：熵就是无序度.我们前面已经说过，气体内分子的数目是非常大的，我们根本不可能描述每一个分子的运动.为了解决这个难题，玻尔兹曼利用了统计的观念，用考察分子运动排列的概率来对相关物理量进行研究.

所谓概率，其实就是可能性.气体里的大量运动分子，总是有的向东有的向西，各个方向都有.对于某个分子而言，它向哪个方向运动都有可能，也就是都有一定的概率.但由于条件的限制，分子在不同方向上运动的概率是不同的.如果我们确定了这些概率，我们就能运用统计规律，得出相应的结果.例如，对于包围你的室内空气而言，就可以计算每个空气分子所有可能的分布方式及其所有可能的运动方式.这就是玻尔兹曼的思想——用统计理论来解释热力学问题，这在当时的物理学界引起了很大的争议.但事实证明，玻尔兹曼是对的.

要在热力学中计算分子处于某个微观状态的概率，首先要计算体系中粒子可能具有的所有不同微观状态的总数，它是一个非常大的数.在1877年的论文中，玻尔兹曼发现了微观状态数与宏观系统的克劳修斯熵之间的关系，并用下面这个关系式把它们联系了起来：

$S \propto \ln W$

组合与组合数公式

微观状态：系统中每一个微粒的各种状态量，比如位置，动量等.

宏观状态：系统的宏观描述，比如P，V，或者速率在某一范围内的粒子数量等.

一般来说，宏观状态包含了大量的微观状态.例如，一个容器内含有2个气体分子，我们想确认这两个气体分子在容器的左边还是右边，

宏观状态：3种：一左一右，左左，右右

微观状态：4种：LL， RR， LR， RL

3个分子时，

宏观状态：4种

微观状态：8种：LLL， (LLR， LRL， RLL)， (LRR， RLR， RRL)， RRR

4个分子时，

宏观状态：5种

微观状态：16种：(all L) (3L， 1R) (2L， 2R) (1L， 3R) (all R)

左上表可以用组合数来给出，即从N个元素中任意拿出2个，一共有多少种组合，

${W_{N,n}} = \frac{{N!}}{{n!\left( {N - n} \right)!}},{W_{6,2}} = \frac{{6!}}{{2!4!}} = 15$

玻尔兹曼常数

原体积为 ${V_1}$ ，在更小的体积 ${V_f}$ 中找到一个气体分子的概率与体积成正比，

$\frac{{{V_f}}}{{{V_1}}}$

在 ${V_f}$ 中找到N个气体分子的概率是找到每1个分子的概率的乘积

${\left( {\frac{{{V_f}}}{{{V_1}}}} \right)^N}$

$probability = p = \frac{{{W_f}}}{{{W_1}}} = {\left( {\frac{{{V_f}}}{{{V_1}}}} \right)^N}$

取对数得

$\ln \frac{{{W_f}}}{{{W_1}}} = N\ln \frac{{{V_f}}}{{{V_1}}}$

对理想气体， $\Delta S = nR\ln \frac{{{V_f}}}{{{V_1}}}$ （自己计算过程，理想气体状态方程： $pV = nRT$ ）,则

$\eqalign{ & \Delta S = \frac{R}{{{N_A}}}\ln \frac{{{W_f}}}{{{W_1}}} = k\ln \frac{{{W_f}}}{{{W_1}}} \cr & \Delta S = {S_f} - {S_1} \cr & = k\ln {W_f} - k\ln {W_1} \cr}$

使用对数的原因是：1.使熵具有合理的大小；2.有利于两个状态的合并.

1990年，物理学家普朗克引进了一个比例系数，将上式写为 $S = k\ln W$ .这就是我们现在习惯使用的玻尔兹曼熵公式，其中 $k = 1.38 \times {10^{ - 23}}$ 焦耳/开.为了纪念玻尔兹曼，我们把它称为玻尔兹曼常数.

根据玻尔兹曼熵公式，熵越大，W也就越大，即微观态数越多，也就是说，分子可以处在更多的微观状态.从宏观上看，整个系统就越混乱越无序.由此，我们可以看出熵的微观意义：熵是分子运动或排列混乱程度的衡量尺度，或者说，熵是系统内分子热运动无序性的量度.

玻尔兹曼熵公式直接沟通了热力学系统的宏观与微观之间的关联，并对热力学第二定律进行了微观解释.原来，热力学第二定律仅仅表明，如果没有外界的干涉，一个孤立的系统总是会越来越混乱.正像懒人的房间，如果没有人替他收拾打扫，只会越来越杂乱下去，决不会自然变得整齐起来.

熵是系统无序性的量度.无序性可以用不可以使用的能量来表示.自发发生的过程始终向增加系统无序性的方向发生.两个温度不同的物体组成的系统比两个温度相同的物体组成的系统呈现出更高的有序性.有序性与组成物体A，B的每个原子的平均动能有联系.如果系统A的温度更高则它的原子的能量更高.如果他们相互有热的接触，则能量会从更高能量的系统流向更低能量的系统，使合成的系统的能量更加均匀地分配，比如，更加无序.所以系统的无序性就会增加.因此我们说熵增加了.但是增加无序性的过程使得从A传递到B的能量可以用于其它目的的可能性被取消了removed，比如在这两个温度不同的物体间操作热机做功的可能性因为增加无序性的过程而成为不可能，所以尽管在温度从高温物体转移到低温物体的过程中能量是守恒的，但是熵的增加导致系统无序性从而用来做功的能量减小了.

维恩辐射定律

维恩用经典热力学证明了黑体辐射曲线形状不随温度而变化，只是长高变宽.但是，热力学方法没有明确得出实际的曲线.1893年，维恩基于实际测量数据猜测出一个公式：

$\rho \left( f \right) = \alpha {f^3}{e^{ - \frac{{\beta f}}{T}}}$

α, β是常量.这个公式似乎意味着基尔霍夫的挑战已经实现了.但是在长波、低频率部分与实际测量值不是非常精确地吻合，并且随着改进了的红外测量技术被引进后，最低频率部分的ρ(f)是 ${f^2}$ 而不是 ${f^3}$ ,并且这些低频率的辐射能量强度与绝对温度成正比.因此维恩的公式不正确，基尔霍夫的挑战依然存在.

普朗克的黑体辐射热力学方法：炉壁内的振子

1898年，普朗克40岁了，是柏林大学久负盛名的理论物理学家.他的早期工作在化学物理领域，将热力学应用于该领域，他取得了极大的成功.他坚信热力学是最深程度地理解自然本质的关键.并且花了好几年时间清理热力学第二定律的各种障碍（熵一直增加）.他相信热力学第二定律非常严格地正确，并且最终可以以更基础的理论加以证明.

现在，热力学通过斯特芬定律和维恩位移定律，已经在分析黑体辐射上开了一个好头.看起来似乎热力学非常可能导出黑体辐射曲线.他感觉这个曲线是理解电磁辐射与物质相互交换能量的关键.这在物理学里是非常基础的问题，具有明显的技术上的重要性.并且，实际上，当时他所在的学校里，实验物理学家们正在将黑体辐射曲线的测量数据的精确度提升到一个新的水平.

（玻尔兹曼已经在分子水平分析了气体的特性，将热力学定量关系与微观粒子的分布联系起来.普朗克对此方法不太看好，因为那个方法暗示热力学第二定律仅仅是统计上的，只在大的系统中适用（比如有大量气体分子）.尽管如此，他对玻尔兹曼的工作还是非常熟悉的，玻尔兹曼教过普朗克几次课，讲了所有的观点.然而普朗克甚至并不确信是否有原子和分子这种东西.）

但是怎么开始用热力学分析黑体辐射呢？实验物理学家们使用的炉子是一个令人生畏的复杂系统：炽热的炉壁内含有大量微小的带电振动微粒（振子），从这些加速运动的带电微粒产生的电磁辐射就是火炉内的光和热.与此同时，这些振子又通过这些振荡的电场补充能量.换句话说，温度不变时，火炉内的辐射和炉壁内的振子处于热平衡态，彼此之间不随着时间的变化而出现能量的增减，但是小分量的能量在每一个振子之间连续地来回传递.

幸运的是，基尔霍夫很早以前就证明了，2个同温度的火炉如果在某些频率上具有不同的辐射能量强度，那么能量可以从一个火炉流flow向另一个火炉，且与火炉的材质无关，这违反了热力学第二定律.因此普朗克可以将他的火炉看做最简单的可以与辐射相互作用的材料：他考虑了一种最简单的简谐运动振子（一维的，质量为m，线性回复力为 $- m\omega _0^2x$ ）.作为预先的练习，他用单频振荡电场 $E\cos \omega t$ 代替杂乱无章（频率之间没有关系）的热辐射来驱动振子，这些振子模型带有电量e，在电磁波理论中已经证明了加速运动的带电体会以辐射的形式失去能量，有效的drag force是

$\left( {\frac{{2{e^2}}}{{3{c^3}}}} \right)\frac{{{{\text{d}}^3}x}}{{{\text{d}}{t^3}}}$ .

振子的运动方程就是

$m\frac{{{{\text{d}}^2}x}}{{{\text{d}}{t^2}}} + m\omega _0^2x - \left( {\frac{{2{e^2}}}{{3{c^3}}}} \right)\frac{{{{\text{d}}^3}x}}{{{\text{d}}{t^3}}} = eE\cos \omega t$

对于受迫振动振子（做阻尼运动的振子受到外力作用）（driven oscillator），普朗克指出

$\frac{{{{\text{d}}^3}x}}{{{\text{d}}{t^3}}} = - {\omega ^2}\frac{{{\text{d}}x}}{{{\text{d}}t}}$

并给出了一个标准的经典力学问题：具有黏性阻尼的受迫振动振子的问题.对这个问题，普朗克找到了以驱动电场大小表示的振子能量.

一个联系振子能量与辐射强度的经典结果

普朗克接下来用温度为T，处于平衡态的火炉内复杂不相关的辐射场代替单一的电场（the single driving field）.这是完全不同的场景，对于单一驱动电场，最初的瞬态行为后，振子稳定在一个与驱动力相适应的固定的振幅和相位上，但是当驱动电场为复杂不相关的电场后，即便是最重要的那些振子的运动频率也趋于自身的固有频率了，运动不再类似钟摆，更像是挂在门口糟糕天气里的篮子.尽管如此，普朗克还是在思考能量交换，他对振子运动的详细描述不感兴趣；振子的能量等于驱动电场的平方（the energy in the oscillator goes as the square of the driving field），当有很多不相关驱动电场时，振子的总能量等于各个电场的平方之和（交叉项将平均为0(cross terms will average to zero)）.

普朗克根据自己的分析，证实了炉壁内振子的平均能量U(f,T)与辐射场的单位频率能量强度 $\rho \left( {f,T} \right)$ 之间的关系：

$\rho \left( {f,T} \right) = \frac{{8\pi {f^2}}}{{{c^3}}}U\left( {f,T} \right)$

这里值得强调的是，这是一个经典结果：唯一的输入是经典动力学和麦克斯韦的电磁理论.注意，振子的带电量e并没有出现在上式中：结果是与振子和辐射之间的耦合强度无关的，耦合强度只需要确保热平衡即可.

振子动力学：普朗克聚焦于熵

有了一个振子的能量与黑体辐射曲线的联系，普朗克认识到，从维恩的辐射定律

$\rho \left( f \right) = \alpha {f^3}{e^{ - \frac{{\beta f}}{T}}}$

他可以完整地导出一个振子的热力学.根据他的热力学第二定律，最自然的方法就是看看熵随着能量如何变化.根据上面的两个方程，能量如下：

$U\left( f \right) = \frac{{\alpha {c^3}f}}{{8\pi }}{e^{ - \frac{{\beta f}}{T}}}$

相应的熵为

$S = - \frac{U}{{\beta f}}\ln \left( {\frac{{8\pi U}}{{\alpha f{c^3}}} - 1} \right)$

热力学中一个重要的定量关系是熵的二阶导数，这与热力学第二定律密切相关：二阶导数为负能保证如果系统被干扰，熵将增加倒回平衡状态.

他发现一个非常简洁的结果：

$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$

二阶导数是负的，他被这一简洁感到吃惊，以为自己已经接近很深的热力学真相.他分析到，这暗示着热力学第二定律和位移定律很可能唯一地决定黑体辐射的曲线，然而他错了.

统计力学应用于一个振子可以给出它的能量为kT已经被人们熟知多年了，为什么普朗克完全没有注意到这一点？他虽然很熟悉玻尔兹曼的工作，但是似乎并不关注统计力学.他是一个旧热力学支持者.

新的实验和理论

1900年10月，柏林的Rubens and Kurlbaum宣布了一些新的实验发现：辐射强度在低频部分是随着 ${f^2}$ 变化不是 ${f^3}$ 变化，而且低频的辐射强度与温度成正比.

这使普朗克感到震惊.对于一个振子，他得到的简单结果

$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$

在高频部分非常接近真相了，但是在低频部分不正确（equipartition was holding）.振子的能量是

$U = kT$

联立 $dU = TdS$ 立即得到

$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{{U^2}}}$

这意味着他之前认为黑体辐射曲线唯一地由

$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$

决定是不正确的.放弃那些最深入的热力学事实，他决定最好是赶紧做出修改.你怎样才能在低频部分得到

$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{{U^2}}}$

而在高频部分得到

$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$

呢？有一个简单的办法：

$\eqalign{ & \frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{U\left( {hf + U} \right)}} \cr & \frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{U\left( {\beta kf + U} \right)}} \cr}$

（这里已经在第1式参数中放入正确的值：k是玻尔兹曼常数，这个参数对于符合低频等式是必须的，维恩公式中的β变换为普朗克常数除以玻尔兹曼常数 $\beta = h/k$ )

这当然是完全没有验证的猜测，但是接着，两次积分得到熵：

$S = k\left[ {\left( {1 + \frac{U}{{hf}}} \right)\ln \left( {1 + \frac{U}{{hf}}} \right) - \frac{U}{{hf}}\ln \frac{U}{{hf}}} \right]$

对此，

$\frac{{dS}}{{dU}} = \frac{k}{{hf}}\left[ {\ln \left( {1 + \frac{U}{{hf}}} \right) - \ln \frac{U}{{hf}}} \right] = \frac{1}{T}$

（右边是绝对温度的热力学定义），得到

$U = \frac{{hf}}{{{e^{\frac{{hf}}{{kT}}}} - 1}}$

从而导出黑体辐射曲线：

$\rho \left( {f,T} \right) = \frac{{8\pi {f^2}}}{{{c^3}}}\frac{{hf}}{{{e^{\frac{{hf}}{{kT}}}} - 1}}$

k是玻尔兹曼常数，h是一个新的常数，现在被称为普朗克常数.

普朗克的这项工作非常出色，它在高频部分与维恩公式相符，在低频部分与T成正比.并且更好的是：在整个频率范围内，它在最小的测量误差内与最精确的测量相符.

伟大的突破：量子力学的诞生

这令人吃惊的好消息使普朗克拼命地寻找理论上的理由！一如既往地，他聚焦于熵：

$S = k\left[ {\left( {1 + \frac{U}{{hf}}} \right)\ln \left( {1 + \frac{U}{{hf}}} \right) - \frac{U}{{hf}}\ln \frac{U}{{hf}}} \right]$

这个形式的表达式应如何解释？这里事情发生了意想不到的转变.他对于玻尔兹曼关于气体原子的熵的分析的了解提供了线索，尽管普朗克自己还怀疑原子的存在性.玻尔兹曼对熵的表达式是

$S = k\ln W$

其中W是对应于给定宏观变量的微观状态总数，k是玻尔兹曼常数.（实际上，这个在玻尔兹曼墓碑上的公式是普朗克第一次写上去的.）

1877年，玻尔兹曼确实分析了一个原子系统并得到了一个与普朗克发现的这个表达式非常相似的熵的表达式.玻尔兹曼的模型只允许原子具有整数倍于某一个非常微小固定能量ε.他于是发现原子的可能的状态数与给定的总能量一致，这种组合（排列组合）的分析，结合斯特林的公式 $\ln N! \cong N\ln N - N$ ，给了他一个熵的表达式，最终，玻尔兹曼得到了ε的极限.

对于简谐振动的振子，相似的分析如何实施呢？再一次，玻尔兹曼的其中一个想法起作用了. 在温度T时具有平均能量U的一个振子的熵与振子被热噪音相互作用而产生的状态总数相关.1884年，玻尔兹曼已经引入了一个全体的概念：对于振子，这个全体就是具有随机状态但是相同U和T的N个振子的集合，因此在某一瞬间，整个集合将呈现单个振子在所有时间内的可能的状态.

全体就具有熵NS，其中S是单个振子的熵.全体的熵就是 $NS = Nk\ln W$ .现在，

$\eqalign{ & S = kN\left[ {\left( {1 + \frac{U}{{hf}}} \right)\ln \left( {1 + \frac{U}{{hf}}} \right) - \frac{U}{{hf}}\ln \frac{U}{{hf}}} \right] \cr & \ln W = N\left[ {\left( {1 + \frac{U}{{hf}}} \right)\ln \left( {1 + \frac{U}{{hf}}} \right) - \frac{U}{{hf}}\ln \frac{U}{{hf}}} \right] \cr}$

N个振子的可能的不同排列数意味着：总能量NU分配给N个振子，有多少种不同的方式？这就是W的含义.实际上，普朗克认识到，或很可能记起了玻尔兹曼的工作，W的表达式非常类似于一个众所周知的组合表达式：将M个物体分配到N个盒子里，有多少种分法，如果假设M个物体都是相同的？答案是

$W = \frac{{\left( {N + M - 1} \right)!}}{{M!\left( {N - 1} \right)!}}$

对于N，M的大数值，使用斯特林公式 $\ln N! \cong N\ln N - N$ ，这变为

$\ln W = N\left[ {\left( {1 + \frac{M}{N}} \right)\ln \left( {1 + \frac{M}{N}} \right) - \frac{M}{N}\ln \frac{M}{N}} \right]$

于是，和前面的公式对比，对于普朗克而言，就有

$\frac{U}{{hf}} = \frac{M}{N}$ 或 $NU = Mhf$

这就是说，普朗克的N个相同频率振子排列的总能量NU等于Mhf，关键地，这个熵的表达式告诉我们，这个能量是一份一份地分配到这些振子中，每一份等于hf.

也就是将总能量NU分成了M份，每一份是hf，即某一时刻，总能量NU是以离散不连续的份量hf分配给各个谐振子.熵的表达式告诉我们，能量在谐振子中的分配是离散不连续的，每一份是hf.

普朗克在看到新的实验数据后，觉得有必要修正他的曲线，在紧张地工作了2个月后，于1900年12月得到上述结论.但是他依然半信半疑，毕竟他的推导的第一部分中，辐射场中的一个谐振子的能量是经典力学的：他假设了能量的发射和吸收都是连续的.然而，他突然做了改变，使用了完全非经典力学的概念，谐振子只能一份一份地失去或得到能量.（他不认为辐射是量子化的，他将这种量子化纯粹地看作是炉壁上谐振子的一种属性）.结果，尽管他的曲线的精确性被大家广泛地认可了，并且视为是量子力学的诞生，然而没有任何人，包括普朗克本人在接下来的好几年里都没有理解这一点.

来源：知乎 www.zhihu.com

作者：alphacalculus

【知乎日报】千万用户的选择，做朋友圈里的新鲜事分享大牛。
点击下载