2.薛定谔的紧箍咒

放出来的量子精灵虽然无法再被收回盒子里,但却应该有物理规律来约束它们的行为,孙悟空不也还有如来发明的紧箍咒嘛。

量子的脚步很快就走进了1925年。这一年,奥地利物理学家薛定谔(Schrödinger,1887—1961年)受德拜之邀在苏黎世作一个介绍德布罗意波的演讲。薛定谔的精彩报告激起了听众的极大兴趣,也使薛定谔自己开始思考如何建立一个微分方程来描述这种“物质波”。这个方程一旦被建立,首先可以应用于原子中的电子上,结合玻尔的原子模型,来描述氢原子内部电子的物理行为,解释索末菲模型的精细结构。

需要描述的是电子的波粒二象性,薛定谔自然首先到经典物理中寻找对应物。

电子作为经典粒子,是用牛顿定律来描述的。如何描述它的波动性呢?考察一下当时的经典力学理论,除了用牛顿力学方程表述之外,还有另外几种等效的表述方式,它们可以互相转换,都能等效地描述经典力学。这些经典描述中,哈密顿—雅可比方程是离波动最接近的。当初,哈密顿和雅可比提出这个方程,就是为了将力学与光学作类比。

人类对“光”的认识,从来就在粒子和波动之间来回摇摆,因此有关“光”的理论,便有几何光学和波动光学两种,分别用来描述光的粒子性和波动性。这两种描述方式并不具有等价性,而是互补的关系。几何光学基于光的“直线传播”,不能解释光的干涉、衍射等性质,此类波动现象必须要用到波动光学的理论,但几何光学可以看作是波动光学在波长趋于零情况下的极限,见图2-2-1。

图2-2-1 薛定谔方程的导出

既然粒子与光类似,也一样具有波粒二象性,那么类比于光线,是否能找到一个电子遵循的波动方程,使得在一定的条件下,回归到经典粒子轨道方程的情况呢?再表述得具体一点,就是说:这个波动方程的零波长极限便应该趋近于电子的经典运动方程,即哈密顿—雅可比方程。

爱尔兰科学家威廉 · 哈密顿(William Hamilton,1805—1865年)虽然将力学与光学进行了类比,但他并未明确地导出这样一个电子波动方程。这正好提供了机会,让薛定谔跟着他的思路,将上述模式运用到量子力学中。当年的薛定谔风流倜傥,女友无数。正好又碰上了一个早期的神秘女友。据说两人旧情复发,去白雪皑皑的阿尔卑斯山上度假数月,甜蜜的爱情大大激发了薛定谔的科学灵感,著名的薛定谔方程横空出世!之后,薛定谔用他的方程来计算氢原子的谱线,得到了与玻尔模型及实验符合得很好的结果[5]

电子既是粒子,又是波。经典力学中用牛顿定律描述粒子的运动规律,量子力学中用薛定谔方程描述“粒子波”的运动规律。这两类方程以及它们的解有些什么区别?

牛顿方程的解:xt),是空间位置x随时间变化的一条曲线,显示粒子在空间运动的轨道。薛定谔方程的解:ψx,t),是一个空间及时间的复数函数,通常被称为“波函数”。在以上函数中,表示粒子在三维空间位置的x成为自变量之一,t代表时间。图2-2-1最右边的两个图显示了两种情形的区别:牛顿经典轨道xt)只是几条线,量子波函数解ψx,t)却弥漫于整个空间。粒子轨道的概念容易被人接受,但对波函数的解释却众说纷纭。

既然认为电子(以及其他粒子)也是一种波动,波动当然会弥漫于整个空间。但应该如何解释这种整个空间都存在的波函数呢?无非有两种观点:一种属于几率诠释,认为波函数的平方,是粒子在某个时刻某个点出现的概率。粒子在某个时刻,仍然只是存在于空间中的某一个固定点。另一种解释本质上是属于“场论”的观点,认为电子是同时存在于空间各处的“波”的量子叠加态。量子态的叠加在量子物理中很重要,量子现象的奇妙性就来自于叠加态。相对而言,几率诠释更易理解。但基于这两种观点,人们有时将ψx,t)称为波函数,有时又称为“量子态”,所指的基本上是一个意思:量子体系的数学描述。

比较一下图2-2-1右上和右下公式中的薛定谔方程和哈密顿—雅可比方程,可以看出经典力学是量子力学的“零波长极限”,实际上也就是当普朗克常数h趋于0时候的极限。普朗克常数h在这里又出现了,正如之前所说的,它是量子的标志。

薛定谔方程和哈密顿—雅可比方程都是偏微分方程,公式中将时间的偏导数明显地写成了时间微分算符的形式。经典方程中的算符是(∂/∂t),薛定谔方程中的算符中则多了一个乘法因子(-iħ),是虚数i和约化普朗克常数ħ(=h/2π)的乘积。这里h表征量子,h数值很小,因而薛定谔方程只在微观世界才有意义。虚数i,则代表了波动的性质,对波动而言,每一个点的“运动”不但有振幅,还有相位。相位便会将复数的概念牵扯进来。

因此,普朗克常数、复数还有算符,三者构成量子数学之要素。算符对量子尤其重要,因为在量子理论中,粒子的轨道概念失去了意义,必须代之以粒子的波函数,或者系统的量子态。那么,原来的经典物理量是什么呢?比如说,表征一个经典粒子最基本性质的物理量是位置、动量、角动量、能量等,在量子力学中应该如何表示它们?

物理学家们发现,原来的经典物理量可以用相对应的算符来表示。经典物理中也使用算符,但算符在量子力学中更重要。什么是算符?算符即运算符号,物理算符是物理学家通常用以表示某种运算过程(或者复杂方程式)的符号,有时候可以用来做一些形式上的代数运算而使得真正的计算简单易懂。只要不要忘记这种算符表达的意义,便往往能够使推导过程看起来简明扼要并且经过最后验证得到正确的结果。

算符并不神秘,实际上,一般的函数和变量都可以算是算符,矩阵是不对易的算符的例子,上文中所示的(∂/∂t),是大家所熟悉的微分算符,也就是微分。微分算符通常作用在函数上,将一个函数作微分变成另一个函数。量子力学中的微分算符作用在系统的量子态上,将一个量子态变成另一个量子态。

几率诠释将波函数解释为粒子在某一点出现的几率幅。根据这种观点,如果对一个量子态某物理量(动量、能量等)进行测量,有意义的是多次测量的统计结果。可以认为每一个经典物理量在量子力学中都对应于一个算符,每次测量的结果将按照一定的概率得到算符的一个本征值。所有测量结果的平均值便与经典力学量测量值相对应。因此,量子算符的本征值必须为实数,才能表示量子力学中的可观测量,这要求量子算符是厄密算符。可以从厄密矩阵的定义来简单理解厄密算符:厄密矩阵是与自己的共轭转置相等的复数矩阵。

那么,与位置、动量、角动量、能量等经典物理量所对应的算符是什么形式呢?下面列出了一部分常见的量子微分算符。

从以上算符表达式可知,薛定谔方程中的(iħ∂/∂t),实际上就是哈密顿算符H的时间微分形式。哈密顿算符H也就是能量算符,薛定谔方程看起来似乎只是个简单的恒等式:左边是算符(iħ∂/∂t)作用在波函数上,右边等于算符H作用于同一波函数上。能量算符H描述系统的能量,在具体条件下有其具体的表达式。一般来说,量子系统的能量表达式可以从它所对应的经典系统的能量公式得到,只需要将对应的物理量代之以相应的算符就可以了。比如说,一个经典粒子的总能量可以表示成动能与势能之和:

将总能量表达式中的动量p及势能V,代之以相应的量子算符,就可得到这个粒子(系统)对应的量子力学能量算符。然后,将此总能量算符表达式作用在电子的波函数上,一个单电子的薛定谔方程便可以被写成如下具体形式[5]

上述薛定谔方程是“非相对论”的,因为我们是从粒子“非相对论”的能量动量关系出发得到了它。所以,薛定谔方程有一个不足之处:它没有将狭义相对论的思想包括进去,因而只能用于非相对论的电子,也就是只适用于电子运动速度远小于光速时的情形。考虑相对论,粒子的总能量关系式应该是:

E2=p2c2+m2c4

薛定谔曾经试图用相对论总能量公式来构建方程。但因为其左边是E的平方,相应的算符便包含对时间的2阶偏导,这样构成的方程实际上就是后来的克莱因—高登方程。但是,薛定谔从如此建造的方程中,没有得到令人满意的结果,还带给人们所谓负数几率的困惑。之后,狄拉克解决了这个问题。