粒子物理入门notes

我本身是高能物理(粒子物理)专业, 之前厚着脸皮好为人师写了很多金融的文章, 但到了老本行物理我却总是很犹豫, 总怕自己的理解不对和不够深入而带偏了其他人. 现在终于博士毕业, 也已经转行金融, 故终于决定写一写, 也算是对我十来年的物理生涯画上一个句号。 虽然我对物理的理解依然浅薄, 但至少可以写一写自己的入门感受和经验教训供人参考,避免后来的人走弯路,还有在这个过程中了解到的世界是个什么东西,体会到的物理的elegance(毁三观),看完这篇文章你们一定会对身边的世界有重新的认识。

我一直觉得知识是世界上少有的越分享越多的东西,所以特别喜欢科普。能够掌握每个知识点,然后融会贯通成一个整体,继而精炼成一个solid的大框架,再提炼出最关键的地方用最直白的语言把整个框架描述出来,让其他人在不知道细节的情况下都能一下明白关键之处,这个过程会让包括自己在内的所有人都受益。

高能物理或者粒子物理其实是一个非常小众的领域, 我们整个机构CERN(欧洲核子研究组织, 全球最大的对撞机, 就是三体里面三体人为了控制人类科技树而抑制的那个…)在全球也只有几千号全职人员, 即使加上所有phd都不知道能不能超过一万人, 而且在日益萎缩…

虽然是一个小众的领域, 但我们研究的问题是最本质(fundamental)的物理,或者代表了人类对科学和世界理解的最前沿。我们的研究对象是微观的fundamental粒子(夸克之类), 为的是探寻宇宙的最本质到底是什么, 接下来我会介绍物理是怎么一步一步evolve到当下的粒子物理的。我也会尽量减少细节甚至牺牲严谨而关注big picture,希望能让大家知道物理本质上在干什么。

下面分为几个chapter来介绍我在这10年的学习过程中学习到的东西,

1. 物理的本质是什么

2. 从原子到夸克

3. 怎么找新粒子

4. PhD的毕业感想

首先感慨一下我上了大学之后才知道真的有夸克这个东西,之前一直以为是科幻小说的情节,甚至上了大学读完物理之后还是对此摸不着头脑。。。但这其实也反而让我对粒子物理产生了兴趣,发现原来这才是物理的最本质,和高中时候了解的物理题完全不一样。

但我刚开始学习物理的感受就是一个字,乱。我也问过身边很多同学,发现普遍有这种感受。

我感觉可能是有两方面的原因,一方面是国内的物理教材实在是惨不忍睹,很多都是自己院里的老师写的,既可以赚钱也可以用来帮助评职称,所以可能有利益相关,但学生就比较惨了,整本书学完题目会做考试会考但完全不知道这个科目在讲些什么。当然也不能把锅全甩给教师,整个科研体制也有问题,感觉身边盆友教师特别青年教师科研和生活压力也很大,一边得想尽办法申请funding,还有做科研发paper挤破脑袋评tenure,另一边还得本科教学和写书,真的是很难兼顾。

另一方面可能是物理本身的问题。物理这个学科很奇怪,学习的process是一种金字塔形状,越学到后面知识越集中越融会贯通。一开始本科的物理教学就是很多不同的分支学科组合而成:四大力学的理论力学,电动力学,热力学和量子力学。除此之外还有衍生出来的电磁学,光学,半导体物理,电子线路,微机原理,固体物理etc。所有这些科目都是分立的,所以在学习的时候最好的情况也就是单个科目可以有一定的理解,但是对于整个物理的全局完全没有任何概念。

曾经我以为物理难在物理,太多细节完全记不住;后来我觉得物理难在数学,太过抽象;现在我感觉其实还是难在物理本身,不可理解而且反直觉。

一言不合上来就开始推公式,物理学书籍的作者似乎都沉醉于数学的推导的细节和严谨,忘记了公式背后的物理解释才是物理的核心。似乎并没有一本书非常详细解释每个物理公式推导背后隐含的物理意义,全都是扔给读者自行解决,内容大多都是繁杂枯燥的计算,读者很容易就在细节中迷失了自己,在我看来对于教导和推广物理并没有很大的帮助。我假想中的物理教材应该是从物理本身着手,用现实的物理现象和问题来循序渐进铺展开来,数学的计算只是解释的一种手段,核心还是需要紧紧抓住物理的本质。所以在陷入物理书籍细节中的时候经常会气馁,我想可能这也人为造成的物理学科的阻碍吧,也导致了大部分物理专业的学生在学习过程中丝毫感受不到物理的美而选择了离开这个领域。很多时候还会有无力感,因为很难把物理的各个科目融合起来,很像被撕扯的感觉但是就是融合不起来。对我来说经常会有一些被撕扯的感觉,因为每一个subject都是投入所有的精力都无法弄明白,甚至每一个分支都没办法弄懂但我总喜欢从fundamental的弄懂,所以总感觉很无力。“吾生也有涯,而知也无涯。以有涯随无涯,殆已!”

最近也在回顾以前学的物理,反思了一下学物理的过程,发现很多时候老师在教的时候教的仅仅是那些点,很少会有老师细致解释怎么把这些点连起来。这也就是整个框架最关键的地方,因为如果没有这些线把点连起来,那整个物理的认识就是散乱并且遇到真正问题的时候很容易垮掉不知所以,所以更难fundamentally解决实际问题和科技突破。不知道是因为老师自己也不太了解,还是说是故意只教这些点然后让学生自己来连起来达到训练或者筛选的目的,作为学生来说这个过程是非常痛苦的。学习这些点会做题也许就花一个学期的时间,但是想要把这些点自己连起来至少需要付出十倍的时间,因为每连一条线都是提出一个为什么,非常需要精力去思考和找到答案。尤其像物理这种领域,各个科目并非独立的,而是在更高一个层面上的融合,科目内的点已经需要花一个学期来弄懂,融会贯通更是需要数倍的精力,然后每个科目融会贯通之后还得把这些科目内的点和其他科目内的点联系起来,就更需要数倍的时间,也许需要花上一辈子的时间来融会贯通。当然,并不需要把所有的知识点全部学全才能开始融会贯通,而是边学边融会贯通的过程。其实这也是人理解世界的方式,我们潜意识里倾向于找联系,连起来的东西更能举一反三,单纯的死记硬背就很表面。

而且物理还有一个很奇特的地方就在于,并非像其他领域这些科目一个是另一个的基础,而实际上是互相穿插互为基础,所以这就是为什么一开始本科学物理的时候完全不知道在干什么,也一度让我非常沮丧,这就是因为只记住了了每个单独科目的各个点。随后掌握了每个单独的科目,但还是感觉不懂,因为缺掉的拼图只能在物理其他的科目里面找到。等把物理全部科目,一直从经典力学到粒子物理融会贯通之后,才能真的把各个学科同时融会贯通,把现在人类所了解的整个拼图给完整拼出来。但依然还有这个拼图解释不了的东西,比如爱因斯坦到去世都没把最微观和最宏观统一起来,未来也会不断引申出去有一个更大的拼图在那儿,至于拼图是不是有边界无法确定,人类也许会永远拼下去。

这其实也可以解释为什么物理需要比其他领域更多的时间,因为好几百年的研究成果,不是花几年就可以掌握的,即使有教材把整个人类拼图的过程都浓缩了出来,但也正是由于浓缩退化成了各个点所以缺少了很多连成线的intuition上的东西,使得理解起来更加困难,所以这也是一个非常靠天赋的学科。可以预见再过五十年的积累,估计这个领域的博士想要真的毕业至少得10年时间,并且知识只会越来越难,消化需要的时间自然就会越来越长,所以读这个专业的人估计也会越来越少。但是,一旦各个科目都融会贯通之后,会有一种一览众山小的成就感,能做到的人真是很稀少。

不可否认,这个过程是一个很好的training,如果能够做到也是非常有成就感或者容易自我感动的一件事,从人类最宏观和最微观的角度,大到10^26米的浩瀚宇宙小到10^-15米的质子和更小的内部夸克结构,万物都可以解释,同时也训练出了那种刨根问底的思维模式,只不过这个过程是非常漫长并且自我怀疑和suffering的。

对于物理的大部分理解其实是我来了美国读书之后体会到的,美国这边课程和国内很不一样,属于精而少。我个人是比较prefer这样的课程,可以更focus在物理本身而不是lost在其各种衍生科目的细节中而不见整片森林。同样是再上一遍四大力学,然后就直接是量子场论(QFT),量子电动力学(QED),量子色动力学(QCD)和粒子物理了。上完之后我才意识到原来之前理解的根本不是真正的物理,而仅仅只是某个单个科目,这些科目都是物理在不同视角被人类观察的表象。就像盲人摸象,物理就是那头大象。这些不同科目的本质就是物理,甚至可以说整个人类science的内核都是物理,而物理的内核是粒子物理或者标准模型(不要慌,马上会详细解释~),这也是我选择这个方向的原因。听起来有点吹牛逼,但我想要了解世界的本质到底是什么。

1. 物理的本质是什么

那么,物理的本质是什么。

我理解的物理本质就是matter和interaction。这其实也是由粒子物理里的standard model标准模型来描述的。

首先我们来看一张图,

这一张图就代表了当今人类对于整个自然界本源的了解。

是不是听起来吊炸天,而且这个table看起来很简单嘛。

确实是很简单。其实物理各种衍生分支不太容易解释,但粒子物理作为最顶点反而更容易科普,这也是我之前提到的金字塔形状。接下来我们来解释这张图到底是个啥意思。

这张图每一个方框都是一个基本粒子(fundamental particles),基本粒子的意思是这个粒子不可再分(至少以人类暂时的科技不可再分),也就是整个宇宙内当今人类能接触到的最微小的东西,也即整个宇宙内所有的物质都是由这几个基本粒子构成。

我们可以看到这张图有四种颜色,紫色,绿色,红色还有黄色,即分为4个sector。紫色是quark夸克sector;绿色是lepton轻子sector,红色是gauge boson的sector,黄色是2012年找到的大名鼎鼎的希格子boson。

我们可以看到夸克和轻子都有3列,在标准模型里面叫做3代(generation),意思就是第1列和第2列,第3列物理性质一致,不同的地方仅仅是质量不同。在物理里面,由于粒子衰变使得质量越轻的粒子越稳定(因为只有从重的衰变成轻的),所以第1列的夸克(上夸克u和下夸克d)和轻子(电子e和电子中微子v_e)是自然界中最稳定的物质。或者换句话说,自然界里面几乎所有稳定物质都是由第1列的夸克和第1列的轻子构成(这里需要注意,夸克和轻子由于是不同的sector所以不能互相衰变)。譬如质子(中子)是原子核的重要组成单元,极其稳定,就是由2个u夸克和1个d夸克(1个u夸克和2个d夸克)组成,然后再和第1列轻子里的电子组合成原子,也即构成了我们的元素周期表。第一列轻子中除了电子还有电子中微子,这是一种质量非常小的粒子,而且不和其他的基本粒子产生强和电磁相互作用,只能通过弱相互作用探测到所以很难捕捉,但在宇宙中大量存在。我们可以把物质matter看成是一个房子,这些夸克sector和轻子sector就是用来建成房子的物质组成单元,砖。

除了砖之外,想要建房子我们还需要水泥或者胶水把砖给粘在一起,这里的水泥就是物理里面负责传递物质之间interaction相互作用的gauge boson粒子。红色粒子就都是gauge boson,负责把夸克和轻子给粘起来形成一个整体。物理最fundamental的interaction和其传递粒子有三种:第一种是gluon胶子,负责传递强相互作用,把夸克和夸克结合起来,比如三个夸克结合起来变成一个质子。第二种是photon,也就光子,负责传递电磁相互作用,把带电的粒子结合起来,比如夸克和轻子结合起来,像质子和电子结合起来就变成了氢原子这样一个稳定的结构。第三种就是W和Z boson,负责传递弱相互作用,两个粒子允许了2,3列generation可以衰变成第1列generation的粒子,形成了我们稳定的宇宙。

除了夸克,轻子还有gauge boson之外,我们还有一个粒子叫做希格子boson。它并不是用来传递相互作用,而是更本质的给与不同粒子不同的质量,使得他们区分于其他粒子(比如不同的generation的夸克或轻子的区别就仅仅是质量)。由于被看做是质量的起源,所以也被人称作上帝粒子。也可以说,就是因为希格子boson使得宇宙有了这么多不同的粒子,也形成了我们缤纷多彩的世界。

上面所有的粒子就是标准模型中用来描述宇宙的最fundamental的粒子,对于每个夸克还有3种不同的颜色,只是多了一个自由度但各方面性质完全一样。所有这些基本粒子他们都有自己的反粒子,仅仅是电荷相反而已,其他性质一模一样。

标准模型的interaction最直观的形式是费曼图,算出来的是每一种interaction过程的可能性。比如最简单的两个电子由于相同电荷而通过电磁相互作用(交换光子photon)互相排斥的这个过程,可以如下表示:

当然,费曼图也可以很复杂(想起粒子物理课里被手算费曼图支配的恐惧,算一个process写满十页纸很正常),比如gluon胶子的相互作用估计得写一百页纸:

对于粒子物理领域很重要的一件事情就是计算费曼图,或者某一个interaction过程的发生概率是多少,因为我们研究的手段就是通过无数次对撞实验来验证这个发生的概率。比如发生概率是一亿分之一,那么我们对撞十亿次就应该可以得到10次的这个interaction过程,如果实验室上测出来100次(远远大于统计误差sqrt(N) = sqrt(10) = 3次, 这里因为假设每次对撞都是poisson分布,其标准差就是sqrt(N)),那就说明有了新的物理并没有考虑进来,这一点会详细在第三章的时候介绍具体在实验上是怎么实现的。

标准模型的table和费曼图看起来很整洁,但其背后的理论基础是如下:

这幅表达式是Lagrangian拉格朗日量,每一项都有其物理意义。拉格朗日量是经典力学里面的名词,作用就是用来概括整个系统的信息,换句话说,如果你知道一个物体或者系统的拉格朗日量,带入欧拉-拉格朗日方程进行信息的“翻译”,你就知道了这个系统的所有动力学信息或者状态,甚至可以对以前和未来进行推导。

我们从牛顿系统, 到了拉格朗日系统, 再到了哈密尔顿系统, 那整个这个过程到底做了什么?

从牛顿系统到拉格朗日系统, 坐标系更为通用, 并且引入了泛函。 而从拉格朗日系统到哈密尔顿系统, 引入了作用量action integral, 并且不再受到坐标系的限制。

这里的拉格朗日量其实是四大力学的统一表达式,并且还结合了狭义相对论对于时间的修正,其实合并起来也就是量子场论,通过杨振宁的Yang-Mills定理将电磁力和弱相互作用统一起来,延伸到U1*SU(2)*SU(3)对称群变成了标准模型,其中U(1)对应于光子photon的电磁相互作用,SU(2)对应于W&Z boson的弱相互作用,SU(3)对应gluon的强相互作用,全部统一起来一起描述整套基本粒子在微观世界的动力学。

这里SU(2)其实是把matter particle(夸克和轻子sector内)两两看成是一对粒子,比如u和d是一对,e和v_e也是一对,所以在量子场论里用到的群论generator是2*2的泡利矩阵,这其实也就是弱相互作用的核心。这里SU(3)指的是前面提到的强相互作用里每个夸克有3种颜色,这样就用到群论generator是3*3的Gell-Mann矩阵。

不知道大家有没有思考过一个问题, 为什么我们探测到的电子都是一模一样的,无论是宇宙初期产生的电子,还是一百多亿年后的现在探测到的电子,都是一模一样的?我一直以来觉得物理最amazing的地方在于,所有的基本粒子都是无法分辨的。和物理学家提出了场这个概念不谋而合,整个宇宙弥漫着每种基本粒子的一个粒子场,并且亘古不变。同一种粒子都是从这同一个场产生出来的,所以才会一模一样。当然,整个宇宙只有一个粒子的理论也能解释全同粒子,虽然脑洞有点大。其实到了量子场论这个阶段,我们就不再把粒子当做一个粒子了,因为粒子由于量子力学也有了波动性,延伸到粒子的本质其实是由于每一种粒子的量子场在某个时间地点由于相互作用产生的激发态。

这里我们可以把整个微观世界的所以量子场看做是一个系统,物理学家想要做的就是想要通过一个统一的拉格朗日量来描述整个微观世界,即一代一代物理学家努力寻找的终极大一统定理。上面的这个式子或者标准模型就是现在人类暂时找到的“大一统定理”,称为宇宙演化的本质也不为过。

这个拉格朗日量第一部分讲的是gluon和夸克(q)的强相互作用。

第二部分讲的是W和Z boson所代表的弱相互作用,加上电磁相互作用,还有希格斯粒子和其他boson的相互作用。

第三部分是讲的是W和Z boson怎么和夸克(u和d)还有轻子(e和v)发生弱相互作用,并且还有希格子粒子怎么给与夸克还有轻子质量。

第四部分和第五部分是费曼图计算的细节,此处略去。

其实这里的“大一统定理“并不是真正的大一统,因为我们还有引力没有考虑进来。引力并没有被囊括在标准模型里面,因为引力在微观世界的scale大小实在太小(引力常数相比电磁力常数,弱力常数还有强力常数显得实在太小)。但在宏观的宇宙尺度,就几乎只有引力在起作用,因为引力的作用范围很长。而类比于其他的三个相互作用力,引力应该也是由某一个粒子来传递,我们假设这个粒子叫做重力子graviton,但至今还没有找到。所以当下的物理其实就分化成了两个极端,一个极小,由标准模型来精准描述;一个极大,由爱因斯坦的广义相对论来精准描述。但物理学家一般都有强迫症,总喜欢把看见的东西给统一起来,还相信统一的结果一定是很简单优美的数学形式。所以怎么把这两端统一起来就是物理学家从上个世纪就一直在寻找的圣杯,真正的万物定理”theory of everything",连爱因斯坦老人家后半生也因为没能把引力囊括进来而郁郁而终,这个终极定理也是每一个物理学家的梦想。

为什么标准模型重要?因为这是宇宙的起点。

我们从图里可以看到我们现在用的加速器LHC所达到的地方就是第一个圈,大爆炸之后的10^-10s。在那个时间,宇宙温度极其高,标准模型里面所有的基本粒子都是自由运动的。如果再往前推进更靠近大爆炸,温度更高的时候,所有的粒子都没有质量,因为那个时候的希格斯粒子场还并没有自发性破缺从而给不同的粒子不同的质量,而且所有的四种相互作用力都渐渐unify成了一种力,如下图,

所以在大爆炸之初的宇宙是一片混沌和高温,只有基本粒子在自由自在的以光速运动(因为没有质量),正反粒子成对产生和湮灭。然而为什么现在正反物质不守恒,为什么有大爆炸,大爆炸之前是什么样子,那时还有时间么,所有这些我们都不知道,似乎整个宇宙和人类就是起源于一次意外。神奇的是标准模型本身是最微观的物理,宇宙是最宏观的物理,但在大爆炸的地方统一了起来,或者这个世界本来应该是微观的,但大爆炸的暴涨了之后就有了宏观。幸运的是,也只有大爆炸之后宇宙的不断冷却,原本的对称被破坏,才使得所有粒子和作用力开始分化,形成了我们现在多样的世界。

再说另外一些疑惑吧,学习粒子物理之后发现学习的东西越来越本质,甚至越来越简单,但让人纠结的是很多以前认为理所当然的东西越来越不是那么显然,甚至完全不make sense。特别进入量子领域之后,物理给我的感觉一直都是怪异,非直觉。

比如, [x, p] = xp - px = ih ,

这个耳熟能详的位置x和动量p的对易关系,进一步又问了一下自己为什么会这个对易关系,汗颜发现竟然答不上来…

就是这个简单的公式导致了不确定原理,也就造就了量子力学的不确定性,或者也可以说我们整个人类现代科技基础都是建立在这个小小的等式上面。甚至从规范场论的角度来说,正是由于这种不对易的关系,才有了non-abelian的SU(2)和SU(3)群的不同粒子,才形成了我们物质的世界。如果这个公式的右边是0,那么就完全退化到了牛顿经典力学,一切事物都是确定的。(当然在宏观世界右边的常数h足够小确实可以近似看作0,这也是为什么宏观世界里牛顿力学就足够了,但就这么小一点差别就完全改写了我们的世界)

翻出来以前的量子力学书看了一通,发现也没有给出很合理的解释,虽然可以从operator推出来,也可以从波粒二象性的x和p互为傅立叶变换去理解,但到了核心为什么的时候都说实验结果就是这样…实在是让人无法满意。

还有不确定原理,特别是能量-时间不确定原理,

\Delta{E}\cdot\Delta{t} \geq \frac{h}{2} ,

这个公式对于粒子物理来说非常重要,因为其决定了粒子的invariant mass(下面会介绍)的width(可以参见书Gauge theory of the strong weak and electromagnetic interactions 和 introduction to quantum filed theory),也决定了这个粒子的衰变速度,甚至这个还决定了为什么只有3个generation(因为如果有多余3个的generation的中微子部分,会对已知的Z boson的width产生贡献,这样就不是现在所测量到的Z boson的width大小,当然也可能有比Z boson还重的中微子故不会贡献,但几率较小)。但是这个能量的不确定原理甚至没有很严格的推导,只是类比了一下动量和位置的不确定原理就凭空出现了,让人摸不着头脑。

除此之外还有波粒二象性,补一个很赞的动画,把微观粒子的粒子性和波动性随着温度的变化非常直观的表现出来了。(他们家的视频都非常赞,很直观的呈现了物理书本上写不清楚的现象,http://toutestquantique.fr/en/)

https://www.zhihu.com/video/1131509963956383744

经典的宏观世界貌似只不过是微观世界的一阶近似。温度越来越低,粒子性就越来越弱,量子波动性越来越强,其实也可以把温度看作是一种跟空间一样的尺度,只要温度足够低或者空间尺度足够小,到达普朗克常数的程度,粒子就会从粒子性逐渐变成概率的波动性,其实也就开始有了量子力学。如果扩展到多体的interaction系统,再叠加狭义相对论融合了时间和三维的空间就有了量子场论,如果再叠加杨振宁做出重大贡献的gauge theory推广到U(1)xSU(2)xSU(3)就得到了粒子物理的标准模型,万物皆场,所有实体的粒子只是这个场的不同激发态,粒子的质量这么普世的东西都仅仅只是场作用下的表象…

但,为什么会有场呢,是客观存在的东西么,还是仅仅人类的数学想象?

虽然经常产生疑惑,但也同时惊叹于大自然的神奇和人类的不可思议,整个宇宙的规律竟然是可以用物理这么简洁的语言来描述的。而且似乎每次数学语言的重大革命,都可以推动人类对于自然界更准确当然也更抽象更统一的概括,从数字的发明到线性代数到群论到弦论,不过现在似乎也遇到了瓶颈,物理和数学的界限越来越模糊,也越来越接近人类想象力的极限,甚至可以说人类对大自然的理解本不该达到现在这么高的程度。而且我现在越来越感觉到我们生活的世界很可能本不应该存在,很可能仅仅只是一次偶然的意外产生了大爆炸,继而偶然的产生了对称性破缺而演化出了现在整个宇宙。学物理的时候就很容易产生这种虚无的感觉,甚至会对人生和整个世界的存在产生怀疑。爱因斯坦也说过,”宇宙最不可理解的事情在于它竟然是可以理解的“。当然我依然相信标准模型背后有一个更general和fundamental的大一统理论在那里等待人们去发掘,但想要有重大突破,我感觉很可能只能寄希望于数学语言的下一次颠覆性突破才会给物理学家一些insight,不知道会等待多少年,希望有生之年还能看到。

好了,上面就是标准模型的理论介绍,下面我们来介绍人类是怎样一步一步探索物理世界。

2. 从原子到夸克

2500年前,古希腊大哲学家Democritus对原子进行了最早的定义,‘by convention sweet and by convention bitter, by convention hot, by convention cold, by convention color; but in reality atoms and void’。

我们一直以来被教育说物质是由分子组成的,分子是保留原物质性质的最小微粒。分子是由原子组成,原子则是用化学方法不能再分割的最小粒子。很自然而然的我们会继续往下猜想,原子的下一步是什么,下下步又是什么,是不是可以无限拆分下去。

下面是一个物体的不断break down,一直到标准模型的夸克。

我们现在知道原子是可分的,原子又由原子核(nucleus)和绕着分布的电子构成,不同原子的原子核又由不同数目的质子和中子构成,质子和中子又由三个夸克构成。到了夸克这个尺度,按照人类的当今技术以及不能继续分下去,因为强作用力的原因我们无法分离夸克进行更深入的研究。

下面来看看人类这一百多年是怎么一步一步得到当今的标准模型的,

发现电子:

1897年,汤姆逊 (J.J.Thomson,1856—1940)在实验中发现了电子。原子在通常情况下是不带电的,从原子中能跑出比它质量小1700倍的带负电电子来说明原子内部还有结构,也说明原子里还存在带正电的东西,它们应和电子所带的负电中和,使原子呈中性。电子是怎么待在原子里的? 原子中什么东西带正电荷?正电荷是如何分布的?带负电的电子和带正电的东西是怎样相互作用的?

汤姆逊提出了一个人们称之为“葡萄干面包”的模型,即原子中带正电部分均匀分布在原子体内,电子镶嵌在其中。

发现原子核:

由于电子质量极小,所以它很有可能是原子的一部分。为了弄清楚原子的结构,英国科学家卢瑟福(Ernest Rutherford,1871-1937)于1911年设计了用带正电的射线——阿尔法粒子(α)轰击金箔的实验,实验中观察到大多数粒子穿过金箔后发生约一度的偏转,但有极小一部分射线发生很大角度的偏转,这种现象只有原子中正电荷集中在很小的体积内时才会发生,说明原子中除了电子还有一个很小的致密的核。卢瑟福证实了带正电的原子核的存在。这样,就从实验上证明了原子的存在,以及原子是由电子和原子核构成的理论。

在此基础上,卢瑟福提出了原子的核式模型,即:原子中心有一个极小的原子核,它集中了全部的正电荷和几乎所有的质量,所有电子都分布在它的周围。卢瑟福从理论上推导出散射公式,后被盖革-马斯顿实验所验证,核式模型从而被普遍接受。但卢瑟福模型正负电荷之间的电场力无法满足稳定性的要求,无法解释电子是如何稳定地待在核外。

发现原子结构:

1913年,丹麦科学家玻尔(Niels Bohr,1885-1962)在卢瑟福模型的基础上提出:电子在一些特定的可能轨道上绕核作圆周运动,离核愈远能量愈高;可能的轨道由电子的角动量必须是h/2π的整数倍决定(h为描述量子大小的普朗克常数);当电子在这些可能的轨道上运动时原子不发射也不吸收能量,只有当电子从一个轨道跃迁到另一个轨道时原子才发射或吸收能量,而且发射或吸收的辐射是单频的,辐射的频率(ν )和能量(E)之间的关系由 E=hν 给出。这个模型解决了原子结构的稳定性问题,解开了原子结构之谜。

发现质子:

1914年,卢瑟福用带正电的射线——阿尔法粒子(α)轰击氢原子。氢原子的半径约为10-8厘米,它的原子核半径约为10-12厘米,只是原子大小的万分之一。氢原子核外只有一个电子,它的束缚能E ~ 13电子伏(eV),远小于电子质量 m_e ~ 0.5×10^6eV。实验结果表明:氢原子的电子被打掉后变成了带正电的阳离子,实际上就是氢的原子核。卢瑟福推测,它就是以前发现的与阴极射线相对的阳极射线,它的电荷量为一个单位,质量也为一个单位,卢瑟福将它命名为质子。

发现中子:

原子是否就由电子和质子组成呢?卢瑟福的学生莫塞莱(Henry Gwyn Jeffreys Moseley,1887-1915)注意到,原子核所带正电数与原子序数相等,但原子量却比原子序数大,这说明,如果原子仅由质子和电子组成,它的质量不够,因为电子的质量很小,相比起来可以忽略不计。基于此,卢瑟福在1920年时猜测,原子核中可能还有一种电中性的粒子存在。

1932年,英国科学家查德威克(James Chadwick,1891-1974)重复德国物理学家波特和法国的约里奥-居里夫妇的实验 。他精心设计,先用α粒子轰击铍,再用铍产生的穿透力极强的射线轰击氢、氮,结果打出了氢核和氮核。由于γ 射线不具备将从原子中打出质子所需要的动量,查德威克断定这种射线不可能是γ射线。他测量了被打出的氢核和氮核的速度,并由此推算出了这种新粒子的质量。他认为,只有假定从铍中放出的射线是一种质量跟质子差不多的中性粒子,才能解释。 根据卢瑟福的猜想将其命名为中子。德国科学家海伯森(Werner Karl Heisenberg,1907-1976)以及前苏联科学家伊凡宁柯(Dimitri Iwanenko,1904-1994)各自独立提出,原子核是由质子和中子组成的。以前的质子-电子模型不能解释许多实验现象,而质子-中子模型可以很好说明原子量与原子序数的关系,很快被人们接受,质子与中子统称为核子 。 

随即人们认识到原子核是由质子和中子构成的,从而得到了一个所有的物质都是由基本的结构单元——质子、中子和电子构成的统一的世界图像。就在这个时候,开始形成了现代的基本粒子概念。

发现介子:

核子是如何组成原子核的呢?质子带正电、而中子是电中性的,核内没有负电荷,许多正电荷为何能挤作一团而不飞散呢?到发现中子为止,人们只知道万有引力和电磁力两种相互作用,它们都是所谓的长程力。而单靠质子间的万有引力远远不足以克服它们之间的电排斥力,在接受了质子-中子模型以后,科学家们开始猜测存在着第三种相互作用力——核子之间的核相互作用。这种力是一种短程相互作用,当质子相距很近时核吸引力超过电排斥力,它们就会互相吸引;当距离增大时核力会急剧减小。

1935年,日本科学家汤川秀树(Yukawa Hideki,1907-1981)提出了“交换粒子”的概念,作为新相互作用理论的基本概念。他认为,这种交换粒子的质量介于电子和质子之间,约为电子质量的250倍左右,质子质量的1/7,他预言的这种粒子后来被称为介子。

1936年,美国科学家安德森(Carl David Anderson,1905-1991)在宇宙线中发现一种比电子约重207倍的粒子,当时误认为就是介子,后来发现这种粒子其实并不参与强相互作用是一种轻子,所以改名为μ子。

1947年,英国物理学家鲍威尔(Cecil Frank Powell,1903-1969)拍摄了大量宇宙射线在不同高度穿过乳胶的底片,并对底片中粒子留下的轨迹进行了仔细分析后发现了汤川所预言的介子,被命名为π介子。

汤川的理论被证实以后,原子核内相互作用的理论研究开始活跃起来。人们认为有两种完全不同的核作用力,一种是强相互作用, 是以π 介子传递方式产生的相互作用(后来证明主要是自旋唯一的矢量介子传递的)具有强度极大、独立于电荷、作用距离和作用时间极短的特点。另一种是弱相互作用,这种弱核力导致了原子核的不稳定性,同时控制着原子核的衰变或放射性,被称为β 衰变。

“基本粒子”的内部结构:

1947年前,只发现了质子、中子、电子、μ子等很少的“粒子”,人们认为这些粒子就是构成物质的最小单元,称它们为“基本粒子”(意为不可分割)。

1947年,英国科学家罗彻斯特(George Dixon Rochester,1908-2001)和巴特勒(Clifford.C.Butler,1922-1999)在宇宙线实验中发现了V粒子(即K介子),这就是后来被称为奇异粒子的一系列新粒子发现的开始。由于它们具有独特的性质——它们因粒子相互碰撞而一起产生,且产生得很快,但却各自独立地衰变得很慢,因起初对此无法解释,所以称为奇异粒子。 1953年,美国科学家盖尔曼(Murray Gell-Mann,1929- )用一个新的量子数——奇异数成功地解释了这一特性(不同的粒子具有不同的奇异数,例如0,±1,±2,……,在描述强相互作用或电磁相互作用时奇异数必须守恒)。在发现的一系列奇异粒子中,有质量比质子轻的奇异介子,有质量比质子重的各种奇异重子(也称超子)。在地球上的通常条件下它们并不存在,在当时的情况下,只有借助从太空飞来的高能量宇宙线才能产生。

为了克服宇宙线流太弱的限制,从20世纪50年代初开始建造能量越来越高、流强越来越大的粒子加速器。实验上也相继出现了新的强有力的探测手段,如大型气泡室、火花室、多丝正比室等。科学家们在宇宙线实验和粒子加速器实验中发现了大量的粒子:p±,p0,K±,K0,Λ,S,Ξ,Δ,等等约一百多种。其中少部分比较稳定寿命长,大部分不太稳定寿命很短,产生出来很快就蜕变成别的粒子 (寿命极短经强作用衰变的粒子也称共振态)(详见“关于共振态的故事”)。这一百多种被称为“基本粒子”的粒子是否都是“基本”的?对比门捷列夫周期表,一百多种化学元素(元素是具有相同质子数(核电荷数)的同一类原子的总称)都是由质子、中子、电子三种更“小”的粒子组成的。人们猜测,一百多种“基本粒子”应该还有内部结构。美国科学家霍夫思塔特(Robert Hofstadter,1915-1990)从1950年开始利用斯坦福大学直线加速器提供的高能电子轰击金、铅、铝和铍等原子核靶,电子被核子弹性散射,按电子的能量以及散射后偏离入射方向的角度进行分类计数,从而描绘出核子的电荷分布,得到原子核结构的概貌。1957年,霍夫思塔特又用能量高达10亿电子伏特的高能电子轰击质子(氢气做靶),探测末态被散射电子的分布。结果表明,质子并不是一个几何点,质子电荷分布在约10-13厘米这样一个小空间范围内。中子也有大小,中子虽然总电荷为零,但在10-13 厘米范围内各个小区电荷密度有正有负。这说明一百多种“基本”粒子不可能都是最小单元,质子、中子有内部结构,它们由更“小”的东西组成。

夸克模型:

科学家们将已经发现的粒子分为两大类。一类是不参与强相互作用的粒子统称为轻子。另一类是参与强相互作用的粒子统称为强子。已经发现的数百种粒子中绝大部分是强子。随着更多的新粒子不断被发现,各种粒子的数量不断增多,需要对它们进行更细的分类认识,分析彼此之间的关系(就象用元素周期表示对元素进行分类)。

1928年,狄拉克将相对论引入量子力学,他建立的狄拉克方程预言:存在与电子具有严格相同的质量,但是电荷符号相反的正电子。

1932年,安德森在宇宙线实验中观察到:高能光子穿过重原子核附近时可以转化为一个电子和一个质量与电子相同但带有单位正电荷的粒子,从而发现了正电子。狄拉克对正电子的预言得到了实验的证实。 反粒子的存在是电子所特有的性质,还是所有的粒子都具有的普遍的性质呢?如果所有的粒子都有相应的反粒子,首先检验的应该是是否存在质子的反粒子、中子的反粒子。24年后的1956年,美国科学家张伯伦(Owen Chamberlain,1920-2006)等在加速器的实验中发现了反质子,即质量和质子相同,自旋量子数也是1/2,带一个单位负电荷的粒子,接着又发现了反中子。

1961年,盖尔曼在奇异数守恒定律的基础上将对称性运用于基本粒子的分类,即SU(3)对称性。他和以色列物理学家内曼(Yuval Neemann,1925-2006)各自独立地提出了强作用对称性的理论——八重法(eightfold way),按照这一方法,把有相近性质的强作用基本粒子分成一个个的族,并认为每个族成员应有8个。八重法很好地说明了强子的自旋、宇称、电荷、奇异数以及质量等性质的规律性(左图),可以把已知的全部基本粒子归类,并且还给未发现的粒子预留了位置,未发现粒子的特性可以从对称的粒子特性推出。

1964年,盖尔曼和兹韦格(George Zweig,1937-)在强子分类八重法的基础上分别提出了更复杂的夸克模型(相当于基本粒子的“周期表”),他认为中子、质子这一类强子是由更基本的单元——夸克(quark)组成的(一些中国物理学家称其为“层子”)。夸克与所有已知的亚原子粒子不同,它们带有分数电荷,例如:+2/3或-1/3。夸克都是两两成对、或三三成群,不可能单独被观测到。它们之间的结合是靠交换胶子,这就是著名的夸克模型。“夸克”一词是盖尔曼从乔伊斯的小说《芬尼根彻夜祭》(Finnegan's Wake)中的诗句改编而来的。

最初,用三种夸克及其反粒子就可以解释当时已发现的强相互作用的粒子,这三种夸克是上夸克(up,u)、下夸克(down,d)和奇异夸克(strange,s)。介子(p±,p0,K±,K0…)由正反夸克对(q`q)构成,重子(p,n,Λ,∑…)由三个夸克(qqq)构成。这里q代表夸克,`q代表反夸克。夸克具有分数电荷,以质子电荷为单位,u,d,s 的电荷分别为2/3,-1/3,-1/3。根据夸克模型,盖尔曼预言某个未发现的粒子应电荷为-1,奇异数为-3,质量为1680兆电子伏。

1964年,在氢气泡室实验中果然观测到了盖尔曼预言的新粒子,称为沃米格负(Ω-),并测得其质量为1672.45±0.29 MeV,与理论的预言完全一致。

虽然夸克模型取得了巨大成功,但科学家们对物质微观结构的研究并没有停止。

1974年,美国华裔科学家丁肇中(Samuel Chao Chung Ting,1936-)与美国科学家瑞奇特(Burton Richter,1931-)分别在实验中发现了一种新粒子,称为J/y粒子。它的质量为3.1GeV(1GeV=1000 MeV),比三个质子还重,但寿命却出奇的长。要想解释它,只能假定存在一种新的夸克——粲夸克(charm)(第四种夸克),用字母c来表示,其质量为1.5GeV。介子J/y由粲夸克与反粲夸克构成 (c`c)。

1977年,美国物理学家莱德曼(Leon M. Lederman,1922-)发现了一种长寿命的新介子¡,它的质量为9.5GeV,只能引入第五种夸克——取名为“美”(Beauty)或“底”(Bottom),用字母b代表。介子¡由底夸克和反底夸克构成 (d`d)。

1994年,美国费米实验室的CDF组在质子-反质子对撞机上发现了一个最重的夸克,质量为176 GeV,取名为顶夸克(top),用字母t代表。科学家们相信这是最后一种夸克了,已经可以得出夸克的完整图像。

量子色动力学(QCD)理论认为,夸克都被囚禁在粒子内部,不存在单独的夸克。有人由此怀疑夸克是否真实存在。然而 这种理论做出的几乎所有预言都与实验测量符合的很好,大部分人相信此理论是正确的。

至此,实验已经证实存在六种不同的夸克,即 u, d, c, s, t, b,称之为六种不同的“味道”(flaver)。  

1964年,美国科学家格林伯格(Oscar Wallace Greenberg)引入了夸克的一种自由度——“颜色”(color)的概念。这里的“颜色”并不是视觉感受到的颜色,而是一种新引入的 量子数的代名词,与电子带电荷相类似,夸克带颜色荷。这样,每味夸克就有三种颜色分别是红、绿和蓝。

夸克的种类由原来的6种扩展到18种,再加上与它们对应的18种反夸克,自然界一共有36种夸克。

轻子模型:

既然参与强相互作用的强子是由夸克组成的,那么不参与强相互作用的轻子是由什么组成的呢?电子是第一个被发现的轻子(1897年),随着研究的深入,科学家们陆续发现了其它轻子。

1931年,泡利为了解释β衰变(原子核自发地放出β粒子(电子)使质子和中子相互转变)中的能量和动量失踪的现象,根据守恒定律预言:应该存在着一种还不知道的极其微小的中性粒子带走了β衰变中那一部分能量和动量,当时泡利将这种粒子命名为“中子”。

1932年真正的中子被发现后,美籍意大利科学家费米(Enrica Fermi,1901-1954)将泡利的“中子”正名为“中微子”(Neutrino)。

1933年,费米提出的β衰变定量理论指出:β衰变就是核内一个中子通过弱相互作用衰变成一个电子、一个质子和一个 反中微子。中微子只参与弱作用,具有最强的穿透力。由于中微子与物质间的相互作用极其微弱,中微子的检测非常困难。

1936年,安德森在宇宙线中发现的比电子约重207倍的粒子,当时误认为是介子,后来发现这种粒子其实并不参与强相互作用是一种轻子,称为μ子。

1942年,中国科学家王淦昌提出了一种利用轨道电子俘获检测中微子的可行方案(K俘获法)。  

1952年,美国科学家戴维斯(Raymond Davis Jr.,1914- )应用王淦昌提出的K俘获法,间接观测到了中微子的存在。

1956年,美国科学家莱因斯(Frederick Reines,1918-1998)和考恩(Clyde Lorrain Cowan,1919-1974)用核反应堆发出的反中微子与质子碰撞,第一次直接证实了中微子的存在。  

1962年,美国科学家莱德曼、舒瓦茨(Melvin Schwartz,1932- )和斯坦伯格(Jack Steinberger, 1921- )在美国布鲁克海文国家实验室的加速器上用质子束打击铍靶的实验中发现中微子有“味道”的属性,证实与μ子相伴的μ子中微子nμ和与电子相伴的电子中微子ne是不同的中微子 (第三、四种轻子)。一年以后,布鲁克海 文的结果又在欧洲核子中心和费米实验室被更高的统计结果所证实。

1975年,美国科学家佩尔(Martin L.Perl,1927- )等人在美国SLAC实验室的SPEAR正负电子对撞机上发现了一个比质子重两倍,比电子重3500倍的新粒子,其特性类似于电子和μ子。经过反复检验,证明是在电子和μ子之外的又一种轻子 (第五种轻子),以希腊字母τ 表示(取自Triton(氚核)的第一个字母)。因为τ 轻子比第一个被发现的轻子——电子重很多,也称它为重轻子。同时有实验迹象表明,存在与重轻子τ 相伴的中微子nτ,相应地存在τ 轻子数守恒。重轻子及其相伴的中微子的发现,轻子由4种增加到6种。因为中微子是轻子的“前辈”,τ 轻子的发现理论上意味着τ中微子的存在。但由于τ 中微子几乎没有质量,又不带电,且几乎不与周围物质相互作用,一直难寻踪迹。

1982年,美国费米实验室科学家用实验支持了τ 子中微子存在的假设。

1989年,欧洲核子研究中心科学家证实τ 子中微子应是最后一类中微子,但没有找到直接的证据。  

1994年,美国加利福尼亚大学的维多里奥·保罗内和费米实验室的拜伦·伦德博格提出了“τ 子中微子直接观测器”的构想,1996年,直接观测器在费米国家实验室建造完成。从1997年起,54位来自美国、日本、希腊和韩国的科学家在费米实验室合作探测τ 中微子。他们用粒子加速器制造一股可能含有τ 中微子的中微子束,然后让中微子束穿过“τ 中微子直接观测器”(右图)内一个约1米长的铁板靶。这一铁板靶被两层感光乳剂夹着,感光乳剂类似于胶卷,能够“记录”粒子与铁原子核的相互作用。

科学家们用3年时间从靶上的600多万个粒子轨迹中鉴定出了4个表征τ轻子存在和衰变的痕迹,这也是表明τ 中微子存在的关键线索。τ 轻子的痕迹被科学家拍摄下来,并在计算机中形成三维图像,其主要特征就是其轨迹里有个结,这是τ 轻子在形成后迅速衰变的表现。据估算,几十万亿个τ 中微子中只有1个与靶中的铁原子核相互作用并生成一个τ 轻子。由此,科学家第一次找到了τ 中微子(第六种轻子)存在的直接证据。2000年7月21日,费米国家实验室宣布了这一重大成果。

科学家们一直从实验和理论两方面对夸克和轻子的内部结构进行研究,迄今的实验尚未发现轻子有内部结构,故人们认为轻子是与夸克属于同一层次的fundamental基本粒子。

标准模型:

1954年,杨振宁和米尔斯提出的杨-米尔斯理论(又称规范场理论)在应用于弱相互作用以及强相互作用研究时遇到了障碍:由于规范理论的规范对称性禁止规范玻色子带有任何质量,这与实验中的观测不相符合,不解决此问题整个研究就失去了基础。

格拉肖1961年提出的弱电统一模型没有解决零质量规范粒子的困难 。1962年,每一个自发对称性破缺都被证明必定伴随着一个无质量无自旋的粒子,问题依然存在。

1964年,英国科学家希格斯(Peter Ware Higgs,1929- )提出了一种克服规范场粒子零静止质量困难的方法。他引入一种标量粒子(后称为希格斯粒子),通过这种粒子的真空自发破缺,可以使与被破缺的规范对称性相对应的规范场获得静止质量。

1967年,温伯格和萨拉姆在格拉肖弱电统一原始模型的基础上,借鉴希格斯的方法发展和完备了弱电统一规范理论。弱电统一理论的预言与实验符合得很好,特别是它所预言的中间玻色子W±和Z0于1983年在欧洲核子中心的实验中观测到了,它们的质量与主要性质都和理论预言符合得相当好。

粒子物理学标准模型以夸克模型为结构载体,在弱电统一理论以及量子色动力学的基础上逐步建立和发展起来。格拉肖等人被称为标准模型的奠基人。

标准模型描述了与电磁力、强作用力、弱作用力三种基本力(没有描述重力)及组成所有物质的基本粒子的所有物理现象,可很好地解释和描述基本粒子的特性及相互间的作用。

标准模型根据自旋将粒子分成分为费米子和玻色子两大类,就好像世界上人类的性别一样重要。费米子(指组成物质的粒子,如轻子中的电子、组成质子和中子的夸克、中微子),有半整数自旋(如1/2,3/2,5/2等),玻色子(指传递作用力的粒子,如传递电磁力的光子、介子、传递强核力的胶子、传递弱核力的W和Z玻色子)有整数自旋(如0,1,2等)。自旋的差异使费米子和玻色子有完全不同的特性。费米子拥有半整数的自旋并遵守泡利不兼容原理;玻色子则拥有整数自旋而并不遵守泡利不兼容原理。 

费米子可以分为三代。第一代包括电子、上及下夸克及电子中微子。所有普通物质都是由这一代的粒子所组成;第二及第三代粒子只能在高能量实验中制造出来,且在短时间内衰变成第一代粒子。这些粒子排列成三代是因为每一代的四种粒子与另一代相对应的四种粒子的性质几乎一样,唯一的分别就是它们的质量。

电子与电子中微子,以及在第二、三代中相对应的粒子,统称为轻子。轻子没有“色”的性质,它们的作用力(弱力、电磁力)会随距离增加变得越来越弱。相反,夸克间的强力会随距离增加而增强,夸克只会在色荷为零的组合中出现,这些不同的组合统称为“强子”。强子分为两种:由三个夸克组成的费米子,即重子(如质子及中子);以及由夸克-反夸克对所组成的玻色子,即介子(如π介子)。

当美国费米实验室1995年3月2日向全世界宣布发现了“顶夸克”时,标准模型所预言的61个基本粒子种的60个都已经得到了实验数据的支持与验证,标准模型中最后一种未被发现的粒子就是希格斯粒子。

首个与标准模型不相符的实验结果在1998年出现:日本超级神冈中微子探测器发表有关中微子振荡的结果显示中微子拥有非零质量,因为零质量粒子以光速行进而不会感受到时间的推移。

标准模型预言的希格斯粒子是自旋为零的玻色子(Higgs boson),是整个标准模型的基石,如果希格斯粒子不存在,意味着整个标准模型将失效。希格斯粒子极不稳定,如果它确实存在,它会在碰撞后10亿分之一秒的时间内衰变。因此,捕捉希格斯粒子极不容易,科学家们已为此做了多年的努力,下决心要找到这个神秘的粒子。

2000年,欧洲核子中心在当时世界上最大的正负电子对撞机LEP上用电子-正电子对撞的方法,在质量约为115GeV的地方发现有希格斯粒子的存在,但当时的统计数据不足,无法得到充分的证实。

2003年,科学家们试图通过美国费米实验室的正负质子对撞机,让质子与反质子相互对撞分析出希格斯粒子的运动轨迹,来证实或否定欧洲核子中心先前的实验结果。但由于计划从旧实验中回收反质子的方案不可行,且运行二十年之久的正负质子对撞机也到了需要更新的阶段,需要很长的时间来修复,此项研究遇到了挫折。

标准模型的建立是20世纪物理学取得的最重大成就之一。迄今为止,标准模型被认为是最有效的一个唯象理论,经受了相当成功的实验检验。但标准模型仍然存在着许多基本的疑难问题有待解决,如希格斯粒子的存在和本质,粒子质量的来源,夸克和轻子更深层次的特征标度,标准模型更深层次上的基本规律等。

标准模型认为物质和反物质是对称的,但宇宙中的物质比起反物质多出很多。

标准模型对重力的忽略,未能为宇宙开始时的宇宙膨胀找出一个机制。

标准模型并不容纳非零质量的中微子,它假设宇宙中只有左旋中微子(即相对于运动轴,其自旋方向为逆时针)。如果中微子质量非零,它们的行进速度会小于光速。这样,理论上就可以超越一颗中微子,以致可以选择一个令这颗中微子运动方向颠倒而自旋不变的参考系,导致它变为右旋。物理学家为此修定标准模型,加入更多的自由参数以准许中微子带质量。新的模型仍叫做标准模型。超对称理论是标准模型的一个延伸,它提出传统模型中的每一种基本粒子都有一个大质量、超对称的伙伴。超对称粒子被视为对暗物质的其中一个解释。

2008年,欧洲核子中心的大型质子对撞机LHC开始运行,并且在2013年已经找到大家期望已久的希格斯粒子,为标准模型填上了人类一直在寻找的最后一块拼图。

3. 怎么找到新粒子?

上面介绍了我们历史上怎么一步一步找到所有这些粒子,那我们现在是怎么做的呢?

首先上一个图,

这就是我们现在正在用的粒子对撞机,横跨法国和瑞士,周长有27km的一个大环。我们高中物理学到过一个带电粒子在磁场中会以环状来运动,这就是为粒子运动轨迹所建造的一个环,在不同的地方会有电场来加速(还记得大明湖畔的正负带电隔板么)。下面有一个官方的视频来介绍这个环是怎么工作的,https://videos.cern.ch/record/2020780。因为加速的过程粒子的速度在变化,所以运动的圆的半径也会变好,所以其实是有很多个不同大小的环来加速粒子,绕着最大的那个环运动的时候就表明粒子已经被加速到最大速度的时候。

为什么要加速粒子呢?

因为我们可以把加速器看做是一个显微镜,其所使用的粒子能量越高,这个显微镜的分辨率就越大。因为波粒二象性告诉我们,任何物体都有相应的波长,速度越快的波长越小。所以我们用来观察的粒子媒介速度越快,波长越小,我们可以利用其观察到的物体的尺度就越小,细节信息就越丰富。

比如我们常用的是光学显微镜,利用的是可见光的波长,最多能观察到头发这个尺度。观察更微小物体的就是电子显微镜,其实是把电子加速到很高的速度使得其波长很小,在生物和材料领域应用很多。然后想要观察到更小的显微镜就得用低能加速器,利用的是加速电子时候韧致辐射所产生的稳定光源,这些光的频率很高,波长很小,所以可以用来观察更微小的物体,我之前在的阿贡实验室就是有一个大概半个世纪前我们用的加速器,现在能量不够大所以不足以继续做高能物理了,就主要应用在材料和生物领域,预约一次scan得提前半年供不应求。

对于我们现在的高能物理来说,正在用的加速器能量是13TeV,已经比50年前的加速器能量高了1000倍,所以可以“看到”更微小的东西,比如原子核甚至夸克。但我们加速质子的目的其实并不是用质子去“看”某个东西,而是为了用质子对撞质子去打破质子的那一层“壳”。由于强相互作用的原因,三个夸克被困在质子的壳里不能分离出来,所以我们需要用非常大的能量(也就是两个质子需要很高的速度去对撞)才能打破这个壳去让壳里面的夸克(还有胶子)和另一个质子里面的夸克(还有胶子)去interaction,也就是费曼图所描述的过程。另一方面,我们加速质子的时候,其内部的夸克和胶子也会同时具有很高的能量,这样在interaction的时候就可以产生更高能量要求的反应过程(不同能量点会有不同的interaction产生,所以就是一直在增加能量来scan未知的高能区可以产生的interaction过程,也许可以发现新的物理现象或者新的基本粒子)。

下面这张图就是展示的怎么用加速器去对撞两束被加速的质子bunches,有了加速器,我们还需要detector探测器去观察对撞出来的粒子,那个对撞点的地方就是我们探测器所在。

下面这张图就是我们ATLAS的探测器,

还有其截面图,

但探测器总的目的就是为了分辨不同的最终粒子,并且探测其动量和能量。

这里能探测到的最终稳定粒子只有这么几种,光子,电子,muons,hadron强子(质子,中子,pion,etc),还有间接探测的中微子。

这里只能探测到最终稳定粒子,因为不稳定的粒子都会瞬间decay成这些稳定的粒子。比如下面Z boson的decay成正负电子对,Z boson是不稳定的,但可以衰变成稳定的两个电子被我们探测到。

这里的hadron强子(一般由quark夸克或者gluon胶子构成)在探测器里的形式是jet,是长下面这个样子。我们在用的时候将其看作是一个整体,或者将hadron看做是一个“粒子”,同样可以测量其整体的动量和能量。

大概整个探测器分为4层部分,从最内层开始,第一层是inner detector(或者tracking chamber),第二层是electromagnetic calorimeter,第三层是hardon calorimeter,最外层是muon chamber。

每一层都有不同的作用,

第一层是为了tracking,也就是让带电的粒子在探测器里面留下痕迹,这样我们就可以根据这个tracking来计算这个粒子的动量还有电荷正负。

第二层是为了收集光子photon还有电子electron,因为这两种粒子会被stop在这一层,这样我们就可以收集其能量信息。

第三层主要是为了收集meson介子(pion等)的能量信息,因为介子会被stop在这一层,其实也就是重建jet这个东西(后面会做解释)。

第四层是为了收集muon的信息,因为muon的质量很大,所以几乎不和材料发生反应很难被捕捉,所以经过前三层filter剩下的粒子就只剩下muon,第四层再探测一遍muon的tracking信息,并且和第一层的tracking信息相match,这样就可以确定这个object是muon。

这里其实还有中微子,中微子只参与弱相互作用所以很难被探测到,但由于截面x-y的动量守恒(因为加速的质子只有运动z方向的动量,所以对撞起始的横截面总动量为0),所以我们可以计算最终所有粒子的横截面动量总和看是不是0,这样来推断出是否由中微子产生,因为如果横截面动量总和不是0,那就说明有某种invisible的粒子带走这这部分的动量导致横截面动量不守恒,通过这种方式来间接探测到中微子。

为什么测量的是动量和能量?因为狭义相对论计算的时候,需要用到思维矢量,同时用到动量和能量的信息(E, \overrightarrow{p}) ,就像也同时会用到时间和距离 (t, \overrightarrow{x}) ,E相对t,p相对x,都是symmetry。

这里值得digress一下。symmetry很有意思,应该算是自然界很奇迹的一个地方,也是标准模型更深层次的内核。

由于Norther’s theorem,我们知道一个symmetry对应一个守恒量(其实本质是群论的对称)。比如时间translation对称对应着能量守恒,空间translation对称对应着动量守恒,rotation对称对应着角动量守恒,前面提到的群论里李群的U1的gauge symmetry对应的是电磁相互作用的电荷守恒,SU(2)的gauge symmetry对应的是弱相互作用的weak isospin守恒,SU(3)的gauge symmetry对应的是强相互作用的夸克color守恒,etc。具体可以参考wiki的下表(https://en.wikipedia.org/wiki/Symmetry_(physics)#Conservation_laws_and_symmetry)

好了回到正题。我们有了探测器所探测到的各个粒子的信息,怎么找到新粒子呢?

一般新粒子都是不稳定的容易衰变的,不然早就直接用探测器看到了。

还是用刚刚的例子,Z boson衰变成正负电子对,

这里我们实际能探测到的是两个电子,而不是Z boson,因为在非常短的时间内(3×10−25s)Z boson就会decay。

这样我们就会想,那么如果我们把这两个电子的质量加起来不就是Z boson的质量了么?

但事实上是在微观世界,我们的质量和能量是可以互相转化的,在粒子高速的情况下其能量甚至可以远远大于其质量,所以这个时候用经典力学里面直接把质量相加就不再成立了。我们就需要用到爱因斯坦的质能方程E=mc^2,这里指的是质量和能量之间的转化,来计算其invariant mass,也就是其parent粒子在微观世界的质量。这里的sum就是分别sum over两个电子的能量和动量然后来计算Z boson的invariant mass。

这是一次对撞的结果,产生了一个Z boson,并且马上decay成两个电子被探测到。

假设我们现在还没有找到Z boson,但理论上预测有这样一个Z boson的invariant mass是90GeV左右,我们怎么去验证这样一个hypothesis呢?

我们会做无数次的粒子对撞实验,然后把所有产生两个电子的对撞信息都记录下来,并且按照上图中的公式算出来每一个对撞的这两个电子的invariant mass,接着画在一张histogram上面。

更直观一点可以看我答辩时候用的slides,这个解释花了很长时间才构思出来,我自认为是最容易让领域外的人理解我们是怎么做analysis的办法,答辩时候做理论的老师都赞不绝口哈哈。

这张图就概括了我们平时是怎么去做hypothesis test来验证是否找到新的粒子。

上面的图x轴是invariant mass,y轴是event数目,我们称每次对撞为一个event(这里Z boson的例子里event指的是所有产生了两个电子的event)。左边的图蓝色是我们的Monte Carlo(蒙特卡洛) simulation的events画在invariant mass这个histogram上,然后是我们现有的粒子物理理论(标准模型,所有已知的粒子理论都被包含在其内,但不包含Z boson因为我们这里假设Z boson是我们想要寻找的新粒子)所产生的对撞结果的模拟。右边的图黑色是在对撞机上实际收集到的数据。

我们比较background理论的simulation和实际收集到的数据,来看他们之间是不是有足够大的discrepancy。因为如果存在足够大的discrepancy,就表明现有的理论(simulation所基于的)和实际的对撞结果之间有很大的差异,也就表明了实际的对撞中有我们现有理论不能解释的部分,也就是新的粒子或者新的物理过程。比如右图中黑色相较于蓝色有一个很大的peak,这个就是新粒子的很强证据,如果这个peak处于invariant mass等于90GeV的地方,很有可能这个粒子就是我们想要寻找的Z boson粒子。

什么叫足够大的discrepancy呢?我们领域内的标准是5个sigma(统计上来说,这里是用黑色线的实际数据来reject蓝色线null hypothesis得到的test statistics大小),已经小数点之后好多个0了。这样的高要求就是为了让结果非常保守(应该是世界上对hypothesis significance要求最高的实验了),以至于这种最基础科学的结果几乎不会出错。

但是呢,我们不是随机的去search大的的discrepancy,而是根据signal粒子(这里要找的是Z boson)的理论来指导我们去哪个invariant mass区间去寻找这个discrepancy,不然就如大海捞针花费无数人力把所有region都得scan一遍。

如上图,红色的线就是我们signal理论所产生出来的Monte Carlo simulation,我们就是照着这个红色的线,在实际收集到的数据里面看是不是在invariant mass的指定地方会找到红色这样一个peak,如果找到了那就说明很可能这个粒子就是我们想要找的signal粒子(这里就是Z boson)。

但是因为具体实验中不感兴趣的对撞event实在太多,即使signal存在也会被淹没在大量的background里面而让我们无法看见想要找的discrepancy(discrepancy相比于background太小,统计sigma不够显著)。比如有其他很多过程也可以产生两个电子的final particles,同样也会contribute到这个histogram里面。我们就需要借助signal理论(Z boson)来产生signal Monte Carlo simulation,这样产生的event都是我们想要的signal反应过程events,这样我们就可以通过对比signal MC和background MC的物理variables的分布形状来区分signal和background,这样我们就可以尽可能的减少background并且留下更多的signal,使signal的peak(如果存在的话)足够显著。

如下图,signal和background都在var0,var1还有var0&var1的histogram图中。我们可以看到想要区分signal和background,我们可以在根据绿线来切割signal和background,使得signal留下最多而background都被filter掉。

下图这是我的analysis用variable的cut之前还有之后,红色的是signal,红色曲线背后的各种颜色stacked在一起的histogram,每种颜色是一个不同的interaction过程,一起被当做background。我们可以算出来红色的signal在进行variable cut之后相对background变得显著得多(左边的图红色曲线乘上了100倍使signal易于观察,不然完全看不到),因为我们可以很显著看到background因为这些variables的cut被极大的reduce了,譬如说绿色的background过程contribution就几乎没有了。

这里呢variable的cut我们可以看到是linear cut,被称作传统的cut-based method,其实对于signal和background的boundary地方切割的就很没有效率,那么我们怎么改进这个方法呢?

对了,就是用现在很火的机器学习和深度学习,来做signal和background的binary classification,结果就是这样:

我科研里面主要用的是stochastic boosted decision tree,可以把这个model想象成一个box,每一个对撞event就是如下的一个data structure,

这里的variable指的是探测器里面测量的粒子的物理变量。这样这个model经过signal MC和background MC训练完之后,任意给其一个event(其内部有同样的variable,但不同的值)都可以给出一个signal-like的probability,这样我们可以用test sample中的signal MC还有background MC来把signal-like的probability画成如下的一个histogram,

x轴就是这个model给出的每个event的signal-like的probability(BDTG responds),我们可以看到signal和background被这个signal-like probability分到了两侧,这样我们如果加一个cut在这个BDTG responds上面,比如要求其大于0,这样我们右侧的signal就全保留下来了而左侧的background就都被filter掉了,这样就把这整个机器学习的model变成了一个variable来做cut来reduce background(也可以想象成这个variable是所有使用来区分signal和background的variables的结合体,超级variable)。其他的机器学习深度学习model也是一样,都会将整个model转化成一个超级variable来做同样的事。

然后再把这个训练好的model应用在实际收集到的数据event上面,在这个signal-like的probability的variable上面做相同的cut,通过这样的方法来reduce实际数据中的background,使得想要寻找的signal在实际的数据中足够显著(如果存在的话一定可以被观察到)。然后再用统计的方法计算经过这个cut之后实际收集的数据和background MC之间的discrepancy有多大,也就是计算其hypothesis test的test statistics的大小,也就得到了这个signal粒子是不是存在,5个sigma的discrepancy其实肉眼从图中就可以看出来。

我们可以看到在机器学习和深度学习的帮助下,我们可以非常完美的切割signal和background,使得signal保留的最多而background被reduce的最多,所以signal如果存在的话就会足够显著被看到。

我们领域用的机器学习和深度学习的框架是用C++写的,叫做TMVA,是嵌入在我们的数据分析软件ROOT里面的一个package,当然也是开源的,我个人觉得还是蛮好用的,速度非常快,只不过由于我们领域人手越来越不够所以很可能以后这个package难以继续support,也是挺遗憾的一件事。

我们领域其实应该算是大数据的鼻祖了。互联网就是诞生于我们机构,当初的目的是为了在全球各个高校和国家实验室的高能物理组间传输对撞机的信息,所以就建了一个巨大的局域网,叫万维网。而且机器学习和深度学习大概从九十年代在高能物理内部就开始使用的,因为当初我们应该是世界上数据量最大的一个领域,而且我们的数据有天然的优势那就是全部对撞events都是统计上iid的,所以基本就是ml/dl的完美使用对象。

感觉科研的一部分内容就是找因子,步骤基本上都一样,从物理fundament出发找有能力区分自己thesis的signal和background的因子,看看correlation,用PCA分解一下,然后交给boosting decision tree或者neural network等model算一算权重排个序,最后加入analysis里面增强一下signal。这个流程高能物理都用了几十年了,但很可惜的是,高能物理都没有注意到业界发生的大数据时代的这种趋势,所以并没有引领这个潮流。甚至在我进入高能物理的时候,领域内用机器学习深度学习都依然是非主流。

当然我也可以理解,因为有一个巨大的问题没有办法解决就是机器学习和深度学习预测的error的问题。机器学习一个问题就是只得到一个预测结果,而很难去估计预测的error。并不像linear regression一样可以给予每个感兴趣的x值一个error或者prediction interval,机器学习仅仅是用test data里面全部x的CV的error来算一个average error。我感觉这样其实并不准确,因为就像linear regression一样,不同的x是有不同宽度的error band的,这样我们就可以知道在哪些x的地方的预测error比较大模型比较不稳定,继而知道这个model对于我们感兴趣的x点附近的预测好坏,而不是直接比较所有x值的average error大小来判断模型好坏。

比如在金融领域用machine learning,我们就很难判断这些model预测的涨跌或者幅度或者权重的error是多少,只能自己主观选择信或者不信,反正我是信了。如果有些x附近的prediction error非常大,那其实跟自己随便猜个数字或者方向并没有很大区别,用这样的预测就可能会产生很严重的后果。

我自己想出来的一个办法就是当我们算CV的error的时候,可以加上一个local的选项。比如像smoothing或者gaussian process的方法一样,例如用一个gaussian去span所有的点,越靠近的点给的权重越大,然后把感兴趣x值的所有近邻点的weighted error加起来当作这个点的error,也有点KNN的感觉,这样来estimate预测x点的error也许会更加准确,只要weight选的合适还可以找到一条光滑的prediction interval去cover所有x点的预测值,就像linear regression一样。

我们领域内对于误差是非常保守的(就误差分析这部分至少占据每个analysis一大半的工作量),一定得把误差考虑很全面。但后来也没人问过我这个问题,也就不了了之了。。。

好了,上面的例子就是如何找到一个新粒子,希望大家对高能物理这个神秘的领域有一个大概的了解。

4. 毕业感想

读完了phd有一些心得体会,

phd的training最重要的技能是bottom up然后再up bottom,说更具体一点就是任何行业任何科目从细节里面整合出一套框架的能力,然后再通过这套框架举一反三去操作具体的事情。

从细节入手精炼成自己理解的一套框架,然后自己记住的其实也就是这么一套框架,细节忘了也无所谓,只要知道去哪儿填充就可以,但框架才是自己的核心竞争力。然后对于世界上不同的东西形成了不同的框架之后,甚至可以把不同的框架融合成一个更大的框架,所谓融会贯通。把高度上的优势转化成了维度上的优势,可以从不同的学科不用的行业的高度去理解同一件事情,更加抓住这件事情的本质。(其实我感觉能够抓住事情本质的学科,一个是物理,一个是哲学。一个抓住自然界的本质,一个抓住了人类社会的本质)。因为有这样一套bottom up的系统,所以自己可以站在很高的地方看全局,从而找到global optimization的方式去handle当下的事情,而不会迷失在细节之中不可自拔,具有全局的picture是对自己人生发展至关重要的事情。

经验或者细节很多时候需要有一个大的框架来organize,如果框架非常小,小于经验的总和,那么超出框架部分积累的经验对自己来说毫无意义,仅仅只是单纯的记忆而已。也就是说如果框架没有扩大的话,自己未来的能力将永远被限制在框架之内没有任何提升的空间,除此框架之外自己所拥有的只是记忆和经验本身,而不是融会贯通相连接的知识。这里的框架不仅指不断深挖扩大某个学科的框架,还代表各个不同学科之间框架的融合,这样会形成一个更大的框架,所谓学科内和学科间的融会贯通。所以人的提高本质是是旧框架的打破和重新建立更大的框架。往往这种更大的框架会变的抽象。我发现自己貌似比较擅长融合各个框架。

这一套东西其实不一定是phd才能train出来,其实一切工作中都可以学习到,只不过是看自己有没有那个意识去做这样一件事。up的程度就代表了自己看问题的高度,也代表了自己能够达到的limit。只有不断raise自己的limit才能让自己的发展不受到天花板的限制。但是切记额一定要先bottom up再up bottom,框架虽然重要,但是如果不是自己从细节里面提炼出来的框架就很容易变成空中楼阁,一碰就倒。

回顾一下毕业和找工作的过程,虽然苦但真的还是很有收获的。这样一种struggle的过程我觉得对于每个人都是必不可少的,因为在这个过程内你需要去面对很多现实的问题,衔接学校到社会这样一个过渡转变阶段。

首先需要思考的问题就是想要做什么。以前我想做的是物理,因为我希望能在有生之年知道这个世界是怎么运行的,也不枉二十多年前战胜了数以亿计的兄弟得以投胎成人。但现在大概了解了物理这个领域之后,发现这个领域在2012年希格斯粒子找到之后似乎已经到了瓶颈,而且是依靠我个人努力无法改变的自然界设定,因为就像之前提到了,可能真的未来粒子物理的能区就是一片贫瘠,至少在我有生之年可能是看不见基础物理有任何重大的突破。正好我也对金融挺感兴趣,金融和物理的共同点,都是为了找到规律,并且用量化的手段来建立模型,并且不断优化细节,并且做出预测和判断,唯一的区别就是一个是物理规律,一个是市场规律。高能物理本质上其实就是用各种物理或者统计的方法去提高信噪比,然后做theory的hypothesis test,对物理非常了解,从fundamental的基础上了解自己应该选择哪些variables,然后再选择合适的统计model去做classification,这个角度看跟p quant基本是非常类似的,都是选因子增强signal。这两者看起来毫无关系,但把两者对比会发现有internal的类似,我也算是很lucky能同时喜欢上两个东西,并且都有机会从事这一行。还是得再强调一下兴趣的重要性,在之前机器学习的文章里面结尾也谈到过可以参考,兴趣可以让人最大效率的去做一件事,而且是internal的motivation,会持续不断给予动力和灵感,想做得不好都难。那么有什么东西可以检测自己的兴趣呢,那就是好奇心。如果我们对某一件事情有着强大的好奇心,我们会对这件事朝思暮想,不吃不喝,忘了其他所有的事情。如果你有过类似的感受,那么恭喜你,这就是你的兴趣。但我发现需要非常小心去利用自己的好奇心,如果一次性全都用了,那么就很难持久。好奇心是如此的稀有和珍贵,所以一定要确定完全利用一点一点控制放出来的好奇心来激发自己的动力,才能有持续不断的动力。有能力又有兴趣是最完美的,有能力保证了可以自学,有兴趣保证了自学的效率。

有了兴趣和能力其实还不够,因为你想要的和你能要的往往中间隔了巨大的鸿沟,这个未知的巨大鸿沟也是每个经历过这个过程的人struggle的原因,因为缺少了太多必须的信息需要补上,但又不知道如何去做。特别对于高能物理phd尤其如此,因为读的时间太长,几乎和社会脱节,学校又对找工作没有任何实质性的帮助,所以时常会感到迷茫并且不知道怎么去跨过这个鸿沟。我还算幸运,很早就接触金融的东西也认识了一大批很supportive的盆友,所以对于业界其实并不陌生,但依然感到人生的艰难。

一个是学校几乎没有任何业界connection,这一点在找工作第一步就非常吃亏,因为你没有人去询问应该怎么做,而且也并不会有人教你怎么去network,cold call约吃饭约咖啡了解业界的动态,这些soft skills在理工科甚至都完全不知道其存在,所以这些业界的习以为常需要完全靠自己悟出来并且果断take action是很不容易的,因为会显得你和身边人的格格不入。于我来说可能影响会小一些,因为认识的盆友们都很靠谱,也很愿意和我分享工作上实际的东西,也是我个人很幸运也一直很感激的地方了。

二是cern的科研压力非常大,一直在学习新的东西和trap在琐碎的细节中,每周都有组会和deadline的push,所以不可能说一两个月不工作一心一意找工作(况且你们也知道即使有这个时间物理也很难直接转行)。虽然苦,但对我来说其实也有收获,学会了怎么去有效的multi task。因为我是一个人做一个analysis,其他的analysis都是5-10个左右phd和postdoc一起push,分工明确;但我就一个人要撑起一支队伍,还得教课改作业还有上课写作业考试和找工作…这种情况下,正常方法一件一件的做就肯定做不完,不睡觉也做不完。唯一的办法就是把自己变成10个人,每天把十人份的分工写下来,按照闲置时间长短、重要程度还有先后顺序互相嵌套,使得时间利用率达到饱和,程序一分钟以上的等待时间就得安排另一件事同时做,这样几乎可以让六七个不同的工作同时进行。吃饭洗澡和睡觉的时间也得预先安排好利用起来,不然损失就是整个晚上的几个小时。做起来其实更难,因为首先就得对每一块儿需要的时间和可能出现的问题有很准确的估计,而且自己在做一件事的时候需要随时盯着其他工作的运行情况,以免出现意外风险没有planB,比如之前整个server崩溃了解决不了还得发邮件想各种办法绕过这个问题,还有硬盘大小不够需要把任务更细分成好几份etc,不然如果一个事情没有cover住那这样互相嵌套的系统就像次贷危机一样会崩盘。

除了上面两点,最劣势的是我们领域不可能有实习经历,甚至大部分学生从来都不知道还有找实习这个东西,因为暑假是做科研最黄金的时期,至少我身边这个领域内没听说过谁中途去业界实习。现在工作越来越细分,公司都想找对领域很熟悉直接来了马上能干活的而不是慢慢培养,所以实习经历真的是越来越重要了,但对于高能物理领域,其实处于很尴尬的一个位置,编程做不过cs的phd,统计做不过统计的phd,申请了也很难竞争得上。不像几十年前,Derman(高能物理劝退神书my life as a quant作者)从我们领域出来的时候没有CS也没有统计专业,甚至电脑都是打孔机,既会编程又会统计的可能就只有高能物理领域了,所以转quant之类的还是容易不少,当时很多上街的物理quant大部分都是我们领域出来的,但相比现在,也是唏嘘不已。

最后一点就是心理上压力大,因为读的时间长,所以身边其他专业的小伙伴全都毕业了只剩自己还在校园里,看见他们都有了非常好的去处,要么博后都读完或者没读博后就都去做了faculty,要么去做了quant,要么创了业,要么去了硅谷,都有一个看得见的美好前程,但反观自己连毕业都有巨大压力,再加上做的科研确实也比较难,很容易产生自我怀疑和焦虑的心态。至少对我个人来说,读博的这几年我几乎没有任何的娱乐时间,都一心放在科研还有后期的转行上面。并且转行这个信息怎么和导师说也是很tricky的事情,因为转行一定需要耗费时间精力,站在导师的角度肯定不希望搞物理的同时还搞别的,但站在自己的角度如果不学别的那么就只能被trap在领域内,即使你花的自己的睡觉时间去准备转行,导师可能依然会觉得不务正业没有花足够的时间在科研上,因为科研是一个无底洞,从来没有时间花的足够一说。身边好多被trap在这个领域的phd和postdoc,想继续做下去又因为缺funding整个领域在收缩,数千个postdoc盯着每年全世界那么个位数的机会,错过了前三轮博后的黄金时期,这辈子可能都拿不到教职;想跳出来又没有相应的业界竞争力,并且也没有时间精力还有实习机会去补上相应技能,就变成了温水煮青蛙的dilemma,这样人会活的非常的miserable。而且在这个过程中我发现了一个残酷的真相,你越是争取把科研做得好证明自己的能力,就越难跳出来,因为人的精力是有限的,而现在的工作又越来越细分,很难把两个完全不同的领域同时都做很好。

虽然上面写了这么多困难和suffering的地方(这不是我一个人的体会,同组另外两个美国小哥和我讲的最多的一句话就是it’s frustrating,并且毕业后都是头也不回就消失了…),但to be honest, 我自己觉得这个博士读的还是很值得,从来没有后悔过当初的选择。一是让我有机会近距离接触和学习世界上最fundamental的知识,了解了世界是怎么运转(虽然我没有机会去欧洲亲自看看我们的加速器,可能是我这辈子最大的遗憾了);二是让我学会了独立解决问题和抗压的能力,感觉不同的学习阶段会有不同的体会,本科知道有这样一个东西,研究生知道有这个东西并且知道怎么用,博士生知道有这个东西并且知道怎么用还知道为什么这么用。知道为什么这么用就是因为首先自己会问为什么,多问一个为什么这是一个非常fundamental重要的特质,这是一个人有没有独立思考能力的体现,也是musk说的物理的第一性原理,这也许就是中国的science一直搞不起来的原因和钱学森之问的答案。多问一个为什么其实包括了两部分,一个就是知道问哪些为什么,还有就是知道怎么去找到为什么的答案。

现在我的越来越深体会是,很多时候会问正确的问题比能解决问题更重要,因为解决问题就已经是具体的实施步骤。但更多时候是一开始根本没有一个具体的方向和idea,特别是没有前人经验可以参考的情况下,所以更别说具体怎么实施。而没有方向的时候其实就是因为没有找到并且提出关键的问题,或者说没有抓住事情的核心。很多时候问问题其实并不是问别人,更多是问自己。如果能找到合适的问题提出来,大部分时候自己就已经有一个答案了,然后可以和其他人稍作cross check就可以开始接下来的实施阶段。但是由于大部分时候每个人都是受到自身的限制,不能很全面的思考和提出关键的问题。所以把想法expose给所有人其实就是一个很好的选择。身边如果有人可以帮你直接提出关键的问题是很难得的,大部分时候其实这个关键的问题是一个一个小问题融合出来的,或者说每个人基于自身的资料都掌握这个问题的某一个角度的信息,幸运的话全部融合起来其实就跟这个问题的原貌相差无几了。如果没有那么幸运,即使能拼出来一部分也是相对原有问题的很大进步。这其实也就是交流的目的,本质上就是一个互相提问题激发insight的过程。所以我非常喜欢把自己的想法和问题写出来,一方面可以自己梳理逻辑来总结,另一方面也可以exposed在所有人面前接受各个角度的信息。

除此之外,科研过程还提高了我工作中与人合作的能力。高能物理是一个极其detail driven的学科,科研全是各种软件硬件的细节并且还没有很好的documentation,知识全靠口口相传 ,learning curve即使到了phd毕业也只算刚可以开始做点点事。知道自己不知道并不可怕,至少有个目标research一下就行了,真正怕的是不知道自己不知道,别人也不知道你什么不知道,一个人做analysis都是泪…当然这个环境就迫使我养成了每天总结记学习notes的习惯还是挺好的,至少让我受益匪浅。并且由于细节都是口口相传,遇到了自己解决不了的问题也只能问别人,知道怎么有效的去问问题,真的是一个非常重要的技能,并且我觉得是一辈子都有用的技能。你首先需要基本上已经把问题症结所在给弄清楚了但是自己缺少某些重要的信息所以解决不了,再把问题自己提炼成简短的几句话来描述重点,接着精准的提供足够的细节信息方便别人快速的帮助你。大家时间都很宝贵,上来就一大段没有重点的细节没人愿意帮助你,也没人有义务做你的babysitter,愿意给予帮助已经很感激了。

我自己也总结了一些科研中的教训,希望能留给后面的人作为参考:

  • 属于自己的东西一定要争取,没人会送到你手里
  • 细节的话不懂就要马上问,不要想着自己造轮子解决
  • 比不知道更浪费时间的是,不知道自己不知道
  • 这个领域任何想要躲掉的东西最终都是躲不掉的,不要心存侥幸,反而这种翻来覆去的侥幸心理会消耗更多能量
  • 一定要先有一个长期的计划或者方向再行动,不然做了很多发现方向错了浪费时间。
  • 不仅仅应该知道怎么开始,还得知道怎么结束。一定要知道什么时候坚决止损,不然白白耗精力进去反而还没有成果。
  • 很多时候如果别人指错了路,会让自己非常的耗费时间,特别是在自己还没有完全熟悉整个流程对可能遇到的问题没有预估能力的时候。当然大方向一般是对的,这个自己也能判断,但是具体的路径就会让花费的时间有很大差别了,因为不同的路径会有完全不一样数量和深度的坑。回头看我六七年的科研时间可能花了至少一大半在这个问题上面,这个过程到现在为止我也不知道怎么才能避免,唯一能做的可能就是把坑全部都走一遍就能有自己对问题的一个判断能力,要么就是祈祷别人能够站在你自己的角度去给合理的建议了。
  • 很多时候不要等一切都ready了才去做,很可能一开始方向就是错的,多present也多和其他人讨论可以避免很多错误的方向;也很可能等一切ready之后机会已经错过了,甚至生活本身永远没有ready的时候,永远都是dynamic的
  • 生活是长跑,不要太受到短期情绪的影响,保持积极的心态
  • 很多时候如果delay掉一个target,会导致事情越堆越多,比如在2016之前不知道要做完analysis,那么就得转到release21并且加入2017和2018的data,这就直接导致需要继续等待两年时间,并且随着release的更新等等一直的update,工作并没有减少,并且很多变成了重复性的细节工作,心理上会更加frustrated
  • 问问题或者communication一定要抓住重点,不要说了一堆别人还是不知道问题在哪儿,更不用说让别人来帮你。在来来回回的对话中一定要每次都尽量抓住重点,这样效率最高。但是这个其实是建立在双方都有共同的一个基础知识上面,这一点最难。所以懂的人倾向于跟懂的人交流,不懂的人就需要花费几倍的努力才能达到那个共同的标准进而才能加入交流。其实很多时候去问别人之前做足准备工作,心里都已经有个差不多的答案和比较完备的逻辑,问别人只是为了确认一下细节和方向,而不是让别人整个教你一遍,也没有义务。
  • 不要太在意其他人给的意见,如果每一个都去做那这一块儿永远做不完。比如TMVA这一块儿可能是没有什么提高,但是为了去弄清楚每一个细节会花掉大量的时间。所以其他人的意见听一听就好,确实觉得有帮助的再去做。thesis是自己的。这一行如果不会say no,那么工作永远做不完,因为一个问题可以无限的延伸下去,要敢于说这个我不做,并且argue成功为什么不做。当然argue也是一个非常耗精力的事情,很多时候很难改变别人,甚至还会得罪别人
  • 很多时候做project其实不仅仅要懂得每一个问题怎么发散出去,但基于实效的角度更重要其实是需要知道什么时候收回来。一件事如果还没做完,同时好几个问题都一起发散出去,这个时候会压力很大,会有一种什么都没做好并且怎么做都做不完的感觉。而且最好需要提前知道坑是什么,大概需要花多少精力,如果足够深的话怎么避过去让做事的效率最高。不能求完美,事情是做不完的
  • Getting my things done is the priority. 确定目标,找到方法,填充细节。
  • 最怕的其实并不是苦和累,而是兴趣被逐渐消磨殆尽了,没有了坚持下去的动力。这个时候就会开始怀疑自己做这件事的意义。被科研一直trap住很大的问题在于把自己的斗志或者锐气都给磨掉了,年纪也大了,对你身边的人会更加焦虑。虽然可以说这种捶打可以让性格更加稳定,但我认为对于年轻人来说其实并不是一件好事,并且我还花了很多的能量去keep住这种aggression不因为科研而流失掉
  • 早点毕业,虽然这一行不太可能。比如我还在phd的时候别人博后都读完可以直接青千回去了,这也算是这一行非常不公平的一件事了,所以走学术真的没有什么优势。不仅仅跟领域内相比,跟领域外更是比不了。但很多时候正是由于这种learning curve非常陡,付出的精力和沉没成本极其巨大,让很多博后望而却步,因为之前吃的苦全部都化成0了,又得重新开始。所以这一行如果不是逼到绝境,没有人会在读了7年博士再加上若干轮博后之后选择转行,而是衡量了当下的得失之后会选择还是坚持下去,虽然自己也知道未来的竞争只会更加suffering。
  • presentation能力是博士的核心竞争力,也是人生的核心竞争力。怎么强调都不为过。
  • 优秀的博士通常有一个共同特点:沟通的时候时候,能根据对方的背景和程度,选择最合理的层次和角度,条理清晰的说清楚事情,包括该交代的背景一定都在合理的顺序下交待到。把复杂的东西能给简单扼要的说出来,其实是个技能。
  • 没有人可以告诉你应该走的方向,这世界上只有你在做这件事,只有自己独自摸索每一步的细节,还有坑
  • 掌握一个心理上的平衡非常重要,一方面如果给自己太大压力,就会花费过多的精力在缓和压力上面;另一方面如果没有压力,那很多时候就没有了动力,甚至自我满足和膨胀。人永远都是从痛苦里面才能学习,但也不能太痛苦,以至于给自己加了限制阻碍了自身的进步,那就得不偿失了
  • 大部分人的成就其实真的和天赋没有太大关系,主要是取决于自己把大部分的时间花在哪个方向上了

结尾我想引用双城记的一句话,“This is the best of time, this is the worst of time”

这句话完美的概括了高能物理或者粒子物理的处境,我在答辩的时候写在了开头。一方面是标准模型最后一个预测的粒子希格斯boson已经在几年前找到,标准模型虽然称不上完美但现在已经比较complete,已经是人类对物理世界的最完整的概括了,这是自古以来人类最好的时代;另一方面,正是由于标准模型已经比较完善,所以高能物理专业已经有点下坡路的感觉,失去了理论上大方向的guide,雪上加霜的是由于没有明确的search方向而拿不到funding。下一代加速器到底造不造也是非常具有争议,因为可能我们正处于一个荒漠的能区区间,最悲观的结果就是即使花几千亿造了能量高10甚至100倍的加速器也可能在物理上没有任何收获,这也不是任何一个国家愿意投资和看到的,所以这对于这个领域也是最坏的时代。我还记得当时本科的老师跟我们说,其实我们领域并不希望希格斯boson被找到,我当初没有get到这句话的意思,但由于疑惑一直记着这句话。现在看来确实如此,如果没有被找到那说明标准模型有巨大的缺陷,而理论有了大问题是物理学家最愿意看到的,因为这样说明除了标准模型之外也许还有一个更fundamental的理论model在那里等待被人类发掘,或者说这个领域还有很大的发展空间。但如果希格斯粒子被找到,而标准模型也已经较为complete的话,这个领域似乎瞬间失去了研究的方向和活力,这也是我这几年在领域内最直观的感受。

回顾了一下这么多年在美帝读书的经历,确实收获到了很多东西,也认识了很多好盆友,再次感谢大家在我这段学生期间一直以来的帮助,以后也会尽量去帮助身边的朋友。不管世界怎么变化,变好还是变坏,To see the world as it is, and to love it,这就是令我佩服的英雄主义。

最后推荐一些我买过的物理参考书,为学弟学妹们可以省下一些时间:

1. the lightness of being

2. who cares about particle physics

3. the particle zoo

4. facts and mysteries in Elementary particle physics

5. Feynman lectures on physics, three volumes

6. Introduction to quantum mechanics

7. Modern particle physics

8. modern elementary particle physics

9. principal quantum mechanics 2nd -Shankar

10. Quantum field theory

11. Introduction to elementary particles

12. group theory in nutshell for physics -A.Zee

13. quantum field theory in a nutshell -A.Zee

14. Gauge theory of the strong weak and electromagnetic interactions

15. Introduction to high energy physics

16. introduction to quantum filed theory

来源:知乎 www.zhihu.com

作者:江海

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载