JK 也能聽懂的理論物理(一)

09/09/2020

這是該系列第一篇,第二篇請查看JK 也能聽懂的理論物理(二)

我和相關專業不怎麼沾邊,但綜合受到的普通物理學教育,乘著突然興起的念頭,總想寫點什麼,特別是關於如何正確簡潔地給大眾介紹「深奧」的理論物理。

本文以下內容要求完全的初中物理知識和一定的數學基礎。

時空

世界每時每刻都處於變化和運動中,無數物質組成一個極端復雜的巨大系統,而物理學一直以來的目標,就是在這種復雜性中嘗試找出最核心的規律,使之能在廣闊的時空中普遍地得證正確性。因此,通向現代物理的第一扇大門,便是如何看待時空本身。

1887年,抱著證明以太存在的想法,邁克爾遜(Michelson)和莫雷(Morley)嘗試使用實驗測量以太對光速的影響,但沒有獲得預期結果。在傳統力學環境下,不同參考系的光速可變似乎是合理的,而光速可變勢必證明了傳播光,乃至電磁活動的介質存在。不過,他們的實驗數據啟發了洛倫茲(Lorentz)在1904年使用洛倫茲變換解釋該結果,使用以下公式:

\[L = L_0\sqrt{1 - \frac{v^2}{c^2}}\]

這種嘗試又幫助了愛因斯坦(Einstein)在1905年使用兩條基本假設建立狹義相對論,它們是:

  1. 「光速不變性原理」:在所有參考系中,光速是一個確定的常數 \(c\)。
  2. 「相對性原理」:所有參考系都有相同的物理定理形式,這也是伽利略(Galileo)在經典力學得出的結論的推廣。

在這兩條原理上建立的物理定律,能夠被地球上,宇宙中任意時間任何角落進行的實驗復現,從而保證了物理學的一致性。

讀者可能已經註意到了我所說的「任意時間」這個措辭,如果按照直覺來理解,參考系顯然是一個關於空間的概念,一直以來,人們都認為時間是獨立於我們生活的三維空間存在的,是「唯一神聖」的東西,這樣的看法也被狹義相對論推翻了。

Henceforth space by itself, and time by itself, are doomed to fade away into mere shadows, and only a kind of union of the two will preserve an independent reality.
— Hermann Minkowski

設想兩個參考系 \(F_1\) 和 \(F_2\),他們相對之間有 \(v\) 的均勻速度,參考系 \(F_1\) 中的一個人往自己正上方的天花板(雖然是在真空)發送了一束激光,嘗試測量激光反射回來所用的時間。如果他的中學物理課不是體育課的話,顯然可以省去測量這一步,我們知道,光在這個觀測者測量下所需時間是 \(\Delta t_p = \frac{2L}{c}\)。同樣的,我們相對 \(F_2\) 靜止的一個觀測者,也看到了第一個觀測者射出的激光,他也很好奇,光反射回地面需要的時間是多少?

我們將 \(F_2\) 看到激光射出的瞬間稱為事件 \(A\),將 \(F_2\) 看到激光回到地面的瞬間稱為事件 \(B\),顯然,對於不同的觀察者,這段區間內的光線運動軌跡是不一樣的,這些軌跡反應到直角坐標系 \(x-t\) 上的結果,就是「世界線」。對於 \(F_2\),他看到的光線與地面構成了等腰三角形,如果在這段時間內他在地面上移動了(當然也可能是 \(F_1\) 在運動,我們為了方便,采用 \(F_1\) 的視角) \(\Delta x' = v\Delta t'\) 的距離,我們就有 \(\Delta t' = \frac{2\sqrt{L^2 + (\frac{\Delta x'}{2})^2}}{c}\),整理得 \((c\Delta t')^2 - (\Delta x')^2 = (c\Delta t_p)^2 = 4L^2\)。

推廣到參考系在三維坐標系中的運動,由於 \((\Delta x_p)^2 = (\Delta y_p)^2 = (\Delta z_p)^2 = 0\),我們就推出了一個重要的公式,對任意參考系,我們有:

\[(c\Delta t_1)^2 - (\Delta x_1)^2 - (\Delta y_1)^2 - (\Delta z_1)^2 = (c\Delta t_2)^2 - (\Delta x_2)^2 - (\Delta y_2)^2 - (\Delta z_2)^2\]

這說明了,不同參考系對同一事件「感受」到的時間是不一樣的,我們把這個不變量記為 \((\Delta s)^2\)。盡管現實世界中大部分情況都不是勻速的,我們可以對整個式子取微分,使之仍然成立。

現在,讓我們稍微加加速,將以上的等式改記成

\[ds^2 = \begin{pmatrix} dx_0 & dx_1 & dx_2 & dx_3 \end{pmatrix} \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{pmatrix} \begin{pmatrix} dx_0 \\ dx_1 \\ dx_2 \\ dx_3 \end{pmatrix} = dx_{\mu}\eta^{\mu\nu}dx_{\nu}\]

這一開始看起來非常復雜,但我們只需要如此理解:如果將時空事件在某一參考系中的坐標看作一個連續的四維向量 \(dx_{\mu}\),那麼衡量事件之間正確交互(比如標量積)的尺度,就可以用一個矩陣 \(\eta = diag(1, -1, -1, -1)\) 來表示,這個對角陣被稱為閔可夫斯基(Minkowski)度規。

這樣形式化給我們帶來的一個便利是,我們可以用矩陣運算來表示時空變換了。現在既然我們已經有了一個不變量 \(ds^2\),下一步要考慮的就是,對時空坐標怎樣的變化可以保證 \(ds^2\) 不變,即經過

\[dx_{\mu} \to dx'_{\mu} = \Lambda_{\mu}^{\sigma}dx_{\sigma}\]

我們有

\[ds'^2 = dx'_{\mu}\eta^{\mu\nu}dx'_{\nu} = \Lambda_{\mu}^{\sigma}dx_{\mu}\eta^{\mu\nu}\Lambda_{\nu}^{\gamma}dx_{\gamma} = dx_{\mu}\eta^{\mu\nu}dx_{\nu}\]

解得

\[\Lambda_{\sigma}^{\mu}\eta^{\sigma\gamma}\Lambda_{\gamma}^{\nu} = \eta^{\mu\nu}\]

或者記作

\[\Lambda^T\eta\Lambda = \eta\]

這便是洛倫茲變換所需要滿足的條件。將原本洛倫茲推得的變換公式改寫成四維形式(為了簡單起見,僅作一維上的移動):

\[\begin{pmatrix} \gamma & -\beta\gamma & 0 & 0 \\ -\beta\gamma & \gamma & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}\]

其中 \(\beta = \frac{v}{c}, \gamma = (\sqrt{1 - \beta^2})^{-1}\),我們可以發現它滿足以上公式。

拉格朗日量

我們現在已經有了一個限製條件——狹義相對論,但這個條件還不足以使我們推導出描述自然的等式,或者說,在數學上方程的條件還不夠充分。我們接下來就來講講另一個限製條件,其中體現的優美性和哲學思辨貫穿了整個科學史。

盡管牛頓力學之後的兩百年內,物理學史都是在給這個系統做註腳,但這些註腳最終卻成為了新系統的奠基石。而其中尤為重要的,便是由拉格朗日(Lagrange)和哈密爾頓(Hamilton)共同完善的分析力學。

面對工業革命的浪潮,人們發現自己越來越需要面對機器運動等極其復雜的計算,建立在笛卡爾坐標系上的牛頓力學計算已經不夠用了,分析需要擺脫特定的坐標系。

我們有以下公理:

「最小作用量原理」:定義作用量為 \(S\),運動路徑為 \(x(t)\),自然界中所有運動(變化)的正確路徑都使得作用量最小,即 \(S[x(t)]\) 最小。

這條原理的發現有著悠長的歷史,它似乎暗示著自然界是可以被精巧的數學原理構建的,這樣的思想也被許多人作為上帝存在的證據。早在17世紀,費馬(Fermat)就發現了光線總是沿著耗時最小的路徑傳播,這裏的作用量就是時間(當然這個說法並不準確),經過萊布尼茨(Leibniz),莫佩爾蒂(Maupertius)和歐拉(Euler)等人的發展和作用量概念的提出,它由哈密爾頓最終完善和公理化。

接下來,我們來看看如何從拉格朗日力學重新演繹牛頓力學。

我們定義一個拉格朗日量 \(\mathcal{L}(x, \dot{x}, t)\),使得 \(\mathcal{L} = \frac{dS}{dt}\),即作用量關於時間的微分,則有 \(S[x(t)] = \int_{t_1}^{t_2}\mathcal{L}dt\),力學的目標,就是求出正確路徑 \(x(t)\) 使得 \(S\) 最小(即取得極值)。這個問題在當時是很艱難的,直到變分法的開拓,尤其是偉大的歐拉和拉格朗日的共同工作,才使得計算這些方程成為可能。我們現在暫且把這放到一邊。

我們有歐拉-拉格朗日方程(推導過程見附錄)

\[\frac{\partial \mathcal{L}}{\partial x} - \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}}) = 0\]

設拉格朗日量 \(\mathcal{L} = E_k - E_p = \frac{1}{2}m\dot{x}^2 - V(x)\),即系統動能與勢能之差,代入上式得

\[-\frac{\partial V}{\partial x} = \frac{d(m\dot{x})}{dt} = m\ddot{x}\]

其中 \(\dot{x}\) 作為位置的一階導數便是速度,而 \(\ddot{x}\) 作為二階導數便是加速度。上式也是我們熟悉的牛頓第二定律方程。

拉格朗日力學的作用量采用能量的表示形式,獨立於任何坐標表示,也使得它相較於經典力學更加優越。如果將一般的坐標概念進行推廣(我們在上一節也采取了這樣的思想),設一般形式的拉格朗日量 \(\mathcal{L}(q_1, q_2, q_3, ... , q_s, \dot{q}_1, \dot{q}_2, \dot{q}_3, ... , \dot{q}_s, t)\),並設 \(p = \frac{\partial \mathcal{L}}{\partial \dot{q}}\) 為「廣義動量」(正則動量),我們只需要將該拉格朗日量代入歐拉-拉格朗日方程,就能求出一般系統的動力方程。另外地,我們會將 \(\mathcal{H} = p\dot{q} - \mathcal{L}\) 稱為哈密爾頓量,如果采用 \(\mathcal{L} = E_k - E_p\),計算可得 \(\mathcal{H} = \frac{1}{2}m\dot{x}^2 + V(x)\),這也就是整個系統的能量。

運用洛倫茲變換的對稱性(實際上為龐加萊(Poincare)群,我們將會在之後講到)和拉格朗日量,我們就能夠推導出整個經典力學,電動力學乃至量子力學和場論,無數天才的優美方程都將是這個方法論下的 Special Case。

下一篇裏,我們將會聊聊隨後發展的量子力學中存在的諸多問題與解決,相比較於這一篇在數學上的一定要求,下一篇將會較為親切一點(我知道你們都不喜歡看公式x),敬請期待。

附錄:歐拉-拉格朗日方程的推導

我們的目標是尋找 \(S = \int_{t_1}^{t_2}\mathcal{L}(x, \dot{x}, t)dt\) 的極小值,設極小分量 \(\epsilon(t)\),即使得

\[S' - S = \int_{t_1}^{t_2}(\mathcal{L}(x + \epsilon, \dot{x} + \dot{\epsilon}, t) - \mathcal{L}(x, \dot{x}, t))dt = 0\]

對 \(S'\) 進行泰勒展開

\[\mathcal{L}(x + \epsilon, \dot{x} + \dot{\epsilon}, t) = \mathcal{L}(x) + (x + \epsilon - x)\frac{\partial \mathcal{L}}{\partial x} + (\dot{x} + \dot{\epsilon} - \dot{x})\frac{\partial \mathcal{L}}{\partial \dot{x}} + ...\]

由於在 \(S\) 處取得極值,故我們舍棄二次以上項得

\[\int_{t_1}^{t_2}(\epsilon\frac{\partial \mathcal{L}}{\partial x} + \dot{\epsilon}\frac{\partial \mathcal{L}}{\partial \dot{x}})dt = 0\]

由分部積分得

\[\int_{t_1}^{t_2}dt\dot{\epsilon}\frac{\partial \mathcal{L}}{\partial \dot{x}} = \epsilon\frac{\partial \mathcal{L}}{\partial \dot{x}}\biggr\rvert_{t_1}^{t_2} - \int_{t_1}^{t_2}dt\epsilon\frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}})\]

由於固定了起點和終點,因此我們有 \(\epsilon(t_1) = \epsilon(t_2) = 0\),代入得

\[\int_{t_1}^{t_2}dt\epsilon(\frac{\partial \mathcal{L}}{\partial x} - \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}})) = 0\]

由雷蒙引理(Du Bois-Reymond lemma)

對 \([x_1, x_2]\) 上的連續函數 \(f(x)\) 和無窮小量 \(\eta(x)\),若 \(\int_{x_1}^{x_2}\eta(x)f(x)dx = 0\) 且 \(\eta(x_1) = \eta(x_2) = 0\),我們有 \(f(x) = 0\)。

\[\frac{\partial \mathcal{L}}{\partial x} - \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}}) = 0\]

即歐拉-拉格朗日方程成立。

參考資料

  1. J. Schwichtenberg, Physics from Symmetry(2nd Edition), Springer, 2018.
  2. Prof Kenneth Young on A Special Lecture: Principle of Least Action, The Chinese University of Hong Kong.
  3. 林琦焜, 最小作用量原理, 數學傳播 35卷1期, 2009.
  4. Many entries on Wikipedia.

「前頁」 | 「首頁」