JK 也能聽懂的理論物理 [theo]

這些筆記源於我早些時候不成熟的思考，雖然並不存在重大謬誤，但觀點顯得過於淺顯了。 –20.06.2025

我和相關專業不怎麼沾邊，但綜合受到的普通物理學教育，乘著突然興起的念頭，總想寫點什麼，特別是關於如何正確簡潔地給大眾介紹「深奧」的理論物理。

本文以下內容要求完全的初中物理知識和一定的數學基礎。

1. 時空 [spacetimes]

世界每時每刻都處於變化和運動中，無數物質組成一個極端復雜的巨大系統，而物理學一直以來的目標，就是在這種復雜性中嘗試找出最核心的規律，使之能在廣闊的時空中普遍地得證正確性。因此，通向現代物理的第一扇大門，便是如何看待時空本身。

1887年，抱著證明以太存在的想法，邁克爾遜(Michelson)和莫雷(Morley)嘗試使用實驗測量以太對光速的影響，但沒有獲得預期結果。在傳統力學環境下，不同參考系的光速可變似乎是合理的，而光速可變勢必證明了傳播光，乃至電磁活動的介質存在。不過，他們的實驗數據啟發了洛倫茲(Lorentz)在1904年使用洛倫茲變換解釋該結果，使用以下公式：

$$L = L_{0} \sqrt{1 -\frac{v^{2}}{c^{2}}}$$

這種嘗試又幫助了愛因斯坦(Einstein)在1905年使用兩條基本假設建立狹義相對論，它們是：

「光速不變性原理」：在所有參考系中，光速是一個確定的常數$c$。
「相對性原理」：所有參考系都有相同的物理定理形式，這也是伽利略(Galileo)在經典力學得出的結論的推廣。

在這兩條原理上建立的物理定律，能夠被地球上，宇宙中任意時間任何角落進行的實驗復現，從而保證了物理學的一致性。

讀者可能已經註意到了我所說的「任意時間」這個措辭，如果按照直覺來理解，參考系顯然是一個關於空間的概念，一直以來，人們都認為時間是獨立於我們生活的三維空間存在的，是「唯一神聖」的東西，這樣的看法也被狹義相對論推翻了。

Henceforth space by itself, and time by itself, are doomed to fade away into mere shadows, and only a kind of union of the two will preserve an independent reality.
— Hermann Minkowski

設想兩個參考系$F_1$和$F_2$，他們相對之間有$v$的均勻速度，參考系$F_1$中的一個人往自己正上方的天花板（雖然是在真空）發送了一束激光，嘗試測量激光反射回來所用的時間。如果他的中學物理課不是體育課的話，顯然可以省去測量這一步，我們知道，光在這個觀測者測量下所需時間是。同樣的，我們相對$F_2$靜止的一個觀測者，也看到了第一個觀測者射出的激光，他也很好奇，光反射回地面需要的時間是多少？

我們將$F_2$看到激光射出的瞬間稱為事件$A$，將$F_2$看到激光回到地面的瞬間稱為事件$B$，顯然，對於不同的觀察者，這段區間內的光線運動軌跡是不一樣的，這些軌跡反應到直角坐標系$x-t$上的結果，就是「世界線」。對於$F_2$，他看到的光線與地面構成了等腰三角形，如果在這段時間內他在地面上移動了（當然也可能是$F_1$在運動，我們為了方便，采用$F_1$的視角）的距離，我們就有 $$\Delta t' = \frac{2\sqrt{L^2 + (\frac{\Delta x'}{2})^2}}{c}$$ 整理得 $$(c\Delta t')^2 - (\Delta x')^2 = (c\Delta t_p)^2 = 4L^2$$

推廣到參考系在三維坐標系中的運動，由於 $$(\Delta x_p)^2 = (\Delta y_p)^2 = (\Delta z_p)^2 = 0$$ 我們就推出了一個重要的公式，對任意參考系，我們有：

$$(c\Delta t_1)^2 - (\Delta x_1)^2 - (\Delta y_1)^2 - (\Delta z_1)^2 = (c\Delta t_2)^2 - (\Delta x_2)^2 - (\Delta y_2)^2 - (\Delta z_2)^2$$

這說明了不同參考系對同一事件「感受」到的時間是不一樣的，我們把這個不變量記為$(\Delta s)^2$。盡管現實世界中大部分情況都不是勻速的，我們可以對整個式子取微分，使之仍然成立。

現在，讓我們稍微加加速，將以上的等式改記成

$$ds^2 = \begin{pmatrix} dx_0 & dx_1 & dx_2 & dx_3 \end{pmatrix} \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{pmatrix} \begin{pmatrix} dx_0 \\ dx_1 \\ dx_2 \\ dx_3 \end{pmatrix} = dx_{\mu}\eta^{\mu\nu}dx_{\nu}$$

這一開始看起來非常復雜，但我們只需要如此理解：如果將時空事件在某一參考系中的坐標看作一個連續的四維向量$dx_{\mu}$，那麼衡量事件之間正確交互（比如標量積）的尺度，就可以用一個矩陣$\eta = diag(1, -1, -1, -1)$來表示，這個對角陣被稱為閔可夫斯基(Minkowski)度規。

這樣形式化給我們帶來的一個便利是，我們可以用矩陣運算來表示時空變換了。現在既然我們已經有了一個不變量$ds^2$，下一步要考慮的就是，對時空坐標怎樣的變化可以保證$ds^2$不變，即經過

$$dx_{\mu} \to dx'_{\mu} = \Lambda_{\mu}^{\sigma}dx_{\sigma}$$

我們有

$$ds'^2 = dx'_{\mu}\eta^{\mu\nu}dx'_{\nu} = \Lambda_{\mu}^{\sigma}dx_{\mu}\eta^{\mu\nu}\Lambda_{\nu}^{\gamma}dx_{\gamma} = dx_{\mu}\eta^{\mu\nu}dx_{\nu}$$

解得

$$\Lambda_{\sigma}^{\mu}\eta^{\sigma\gamma}\Lambda_{\gamma}^{\nu} = \eta^{\mu\nu}$$

或者記作

$$\Lambda^T\eta\Lambda = \eta$$

這便是洛倫茲變換所需要滿足的條件。將原本洛倫茲推得的變換公式改寫成四維形式（為了簡單起見，僅作一維上的移動）：

$$\begin{pmatrix} \gamma & -\beta\gamma & 0 & 0 \\ -\beta\gamma & \gamma & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}$$

其中 $$\beta = \frac{v}{c}, \gamma = (\sqrt{1 - \beta^2})^{-1}$$ 我們可以發現它滿足以上公式。

2. 拉格朗日量 [lagrangian]

我們現在已經有了一個限製條件——狹義相對論，但這個條件還不足以使我們推導出描述自然的等式，或者說，在數學上方程的條件還不夠充分。我們接下來就來講講另一個限製條件，其中體現的優美性和哲學思辨貫穿了整個科學史。

盡管牛頓力學之後的兩百年內，物理學史都是在給這個系統做註腳，但這些註腳最終卻成為了新系統的奠基石。而其中尤為重要的，便是由拉格朗日(Lagrange)和哈密爾頓(Hamilton)共同完善的分析力學。

面對工業革命的浪潮，人們發現自己越來越需要面對機器運動等極其復雜的計算，建立在笛卡爾坐標系上的牛頓力學計算已經不夠用了，分析需要擺脫特定的坐標系。

我們有以下公理：

「最小作用量原理」：定義作用量為$S$，運動路徑為$x(t)$，自然界中所有運動（變化）的正確路徑都使得作用量最小，即$S[x(t)]$最小。

這條原理的發現有著悠長的歷史，它似乎暗示著自然界是可以被精巧的數學原理構建的，這樣的思想也被許多人作為上帝存在的證據。早在17世紀，費馬(Fermat)就發現了光線總是沿著耗時最小的路徑傳播，這裏的作用量就是時間（當然這個說法並不準確），經過萊布尼茨(Leibniz)，莫佩爾蒂(Maupertius)和歐拉(Euler)等人的發展和作用量概念的提出，它由哈密爾頓最終完善和公理化。

接下來，我們來看看如何從拉格朗日力學重新演繹牛頓力學。

我們定義一個拉格朗日量$\mathcal{L}(x, \dot{x}, t)$，使得$\mathcal{L} = \frac{dS}{dt}$，即作用量關於時間的微分，則有$S[x(t)] = \int_{t_1}^{t_2}\mathcal{L}dt$，力學的目標，就是求出正確路徑$x(t)$使得$S$最小（即取得極值）。這個問題在當時是很艱難的，直到變分法的開拓，尤其是偉大的歐拉和拉格朗日的共同工作，才使得計算這些方程成為可能。我們現在暫且把這放到一邊。

我們有歐拉-拉格朗日方程（推導過程見附錄）

$$\frac{\partial \mathcal{L}}{\partial x} - \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}}) = 0$$

設拉格朗日量 $$\mathcal{L} = E_k - E_p = \frac{1}{2}m\dot{x}^2 - V(x)$$即系統動能與勢能之差，代入上式得

$$-\frac{\partial V}{\partial x} = \frac{d(m\dot{x})}{dt} = m\ddot{x}$$

其中$\dot{x}$作為位置的一階導數便是速度，而$\ddot{x}$作為二階導數便是加速度。上式也是我們熟悉的牛頓第二定律方程。

拉格朗日力學的作用量采用能量的表示形式，獨立於任何坐標表示，也使得它相較於經典力學更加優越。如果將一般的坐標概念進行推廣（我們在上一節也采取了這樣的思想），設一般形式的拉格朗日量$\mathcal{L}(q_1, q_2, q_3, ... , q_s, \dot{q}_1, \dot{q}_2, \dot{q}_3, ... , \dot{q}_s, t)$，並設$p = \frac{\partial \mathcal{L}}{\partial \dot{q}}$為「廣義動量」（正則動量），我們只需要將該拉格朗日量代入歐拉-拉格朗日方程，就能求出一般系統的動力方程。另外地，我們會將 $$\mathcal{H} = p\dot{q} - \mathcal{L}$$ 稱為哈密爾頓量，如果采用 $$\mathcal{L} = E_k - E_p$$ 計算可得 $$\mathcal{H} = \frac{1}{2}m\dot{x}^2 + V(x)$$這也就是整個系統的能量。

運用洛倫茲變換的對稱性（實際上為龐加萊(Poincare)群，我們將會在之後講到）和拉格朗日量，我們就能夠推導出整個經典力學，電動力學乃至量子力學和場論，無數天才的優美方程都將是這個方法論下的 Special Case。

3. 測量 [measurement]

It doesn’t matter how beautiful your theory is, it doesn’t matter how smart you are. If it doesn’t agree with experiment, it’s wrong. In that simple statement is the key to science.
— Richard Feynman

再美妙的理論也需要實驗的佐證才能夠被科學所接受，這是一個基本原則。本節的目的便是梳理物理學中的實驗科學發展進程，以及它是如何和理論產生關聯的。

在前牛頓時代，乃至牛頓時代，實驗的觀測對象都是直接的宏觀實體，因此實驗的測量也是直觀的，我們的實驗儀器輔助肉眼，完成了一個人與機械交互的過程，這便是物理實驗。

電動力學給我們帶來了許多不能直接觀察的對象，譬如你要測量場在時空某一點的性質，你所做的可不能是僅僅直接觀察場，你需要設計一場實驗，測出受場影響的粒子性質，以此來計算出場的性質。一個堅實可靠的理論，也許描述的對象並不是可見的，但它一定會提供某種機製與可見對象產生關系。因此，我們可以將一個設計良好的實驗當作黑盒，我們需要的性質會由黑盒的「指針」呈現出來。

這樣的割裂在引入量子力學後愈發地嚴重了起來，根據波動力學的結論，微觀的粒子遵循薛定諤(Schrödinger)方程運動，波恩(Born)定則表明了，波函數為該系統物理狀態（比如能量，動量）的概率密度。一個離散的量子態是多個可能取值的線性組合，根據疊加原理，我們有（省略狄拉克(Dirac)記法）：

$$\psi = \sum_{i} c_i\psi_i$$

看起來仍然還好，這條公設將不可見的量子態與測量結果通過概率聯系了起來，實驗也證實了波恩定則的正確性，但是，從中隱含的一個結論，坍縮假設(Collapse Postulate)，卻帶來了物理學的危機。波恩定則暗示了，一旦我們測量某個量子態得到結果後，其取值也就被確定了，這個過程被稱為坍縮，由此，我們通過觀察保證了多次測量的一致性。

現在讓我們設想這樣一個黑盒子，它的指針準確地指示了一個粒子的動量，比如$p_1, p_2, p_3$，相對應的指針值為$y_1, y_2, y_3$，開始的指針指向$y_0$處。第一次測量得到的結果是$p_2$，指針指向了$y_2$並使得粒子坍縮了。如此應該假定在此後任意時刻的第二次測量都是$p_2$，那麽，遵循宏觀牛頓定律的指針也能夠直接指向$y_2$嗎？我們知道，這是不符合實際的。

這個思想實驗展現出的分歧是，在黑盒的某處，世界被分割為了兩個現實，一個是會坍縮的微觀現實，另一個是我們熟知的宏觀現實，這兩者的界限在哪裏？它們是怎麽聯系的？真的能割裂開嗎？更嚴重的是，所謂使得粒子坍縮的「觀察」也是含糊的，人類存在前的所有波函數都等著坍縮嗎？怎麽區別觀察者和實驗對象？早期的量子物理學就建立在了如此模糊的基礎上。

嘗試用完全量子化手段解決測量問題被證明是反事實的，本節的一個著名例子便是1935年薛定諤(Schrödinger)提出的問題，如流行文化所述，這只可憐的貓在他與愛因斯坦的通信裏反復去世。愛因斯坦是深信著物理的確定性(determinism)的，這是從元物理而非物理學角度得來的肯定，為了能重新恢復物理理論的確定性，他需要另一項有力的武器：局域性(locality)。

我們已經知道了量子力學在深層次上的非確定性，為了解決這樣的矛盾，1926年，玻恩(Bohn)就提出了這樣的解釋：波函數描述的可能不是完整的物理狀態，而是我們對物理狀態的「知識」，而坍縮也就意味著我們知識的更新。同樣的，在愛因斯坦和薛定諤的通訊中，兩人似乎也指向了一個可能的解釋：現有的物理理論缺失了一個或多個重要的變量，加入變量後的量子力學——比如說薛定諤方程，將會擁有確定性。這樣的猜想被稱為隱變量(hidden variables)假設。

然而，一個對隱變量著名的反駁是馮·諾伊曼(Von Neumann)在1932年對量子物理做數學公理化時證明的定理，也即：任何包含隱變量的物理理論都無法和量子力學在實驗上保持一致。但是該證明有很大的局限性，由於諾伊曼限定在了對交換算子的討論和論證，致使貝爾(Bell)在隨後批評該證明是「並不完全錯誤但卻是愚蠢的」。事實上，1952年，玻姆(Bohm)就發表了一個獨立的，帶有隱變量的確定性理論。

4. EPR 佯謬 [epr]

It is wrong to think that the task of physics is to find out how Nature is. Physics concerns what we can say about Nature.
— Niels Bohr

愛因斯坦在隨後繼續致力於批評量子力學的非實在性，在1935年，他和波多爾斯基(Podolsky)、羅森(Rosen)共同發表論文提出了量子力學和局域實在假設的沖突，借此表明量子力學的不完備。簡單起見，我們闡述由玻姆重論述的佯謬(EPRB)。

根據標準模型，粒子具有一種性質稱為自旋(spin)，其取值是離散的，例如（正）電子的自旋取值為$\pm \frac{1}{2}$。假設一個粒子在$x$軸上的自旋為$s$，則我們在與$x$軸夾角為$\theta$的方向上——根據量子力學——測得其自旋為$+s$的概率為$\frac{1 + cos\theta}{2}$，也即$+s$的期望為$scos\theta$。並且哥本哈根詮釋認為，該粒子在未經過測量前自旋是非實在的(non-determined)。

現在，我們有一臺儀器同時發射一對糾纏的正負電子，它們的自旋態疊加為0，也即（同樣省略狄拉克記法）：

$$\phi =\frac{1}{\sqrt{2}}(s \otimes (-s) - (-s) \otimes s)$$

我們在對稱的方向（角度為$\pi$）安排了足夠遠（信息無法及時傳播）的兩個觀察者 A 與 B。觀察者 A 經過測量，得知電子的自旋為$s$，根據坍縮假設，疊加態坍縮為一種狀態，這時，觀察者 B 無需測量正電子，觀察者 A 即可得知正電子的自旋為$-s$，這顯然是實在的，同時也是超距(non-local)的，因此與哥本哈根詮釋矛盾。

愛因斯坦接下來推導：為了不破壞定域性，也就是觀察者 A 的觀察必須不影響 B，一定有一個決定電子自旋的隱變量在發射的時候被確定了。 1952年，玻姆通過引入一個粒子自有的場（隱變量），發展了德布羅意(de Broglie)在1927年提出的導航波理論，解決了量子力學的非實在性，但是，其代價是這個場的傳播是超距的。

讀者一定不會對 EPR 佯謬的思考方式感到陌生，貝爾就用一個生動的例子來評價 EPR 佯謬：如果 Bertlmann 教授喜歡穿不同顏色的襪子，那麽人們看到他一只腳的襪子是粉色時，也一定可以立即知道另一只腳的襪子一定不是粉色的，EPR 相關性無非就是這樣的日常相關性。

對於愛因斯坦來說，不可接受的實際上不是這兩只襪子之間的關系，而是這種相關聯鬼魅般的超距(Spooky at Distance)，哥本哈根解釋沒能回答這個憂慮。愛因斯坦想做的是使用 EPR 關聯作為一個基礎來闡述量子力學的不完美而非錯誤，只是玻爾並沒有能理解這一點。

5. 貝爾定律 [bell]

量子力學是超距的嗎？這個問題其實在很大程度上沒有回答的意義。讓我們先嚴謹地給出局域性的定義：物理實在(objects)在時空中的運動和作用，總是不超過光速地傳播並作用到另一物體。這裏的關鍵在於，我們要討論量子力學的超距性，必須先明白量子力學中的物理實在究竟是什麽，它們之間的作用究竟是什麽？

這其實就是物理學的本體論(Ontology)問題。我們討論牛頓力學的超距性，是因為經典力學中有確切的物理實在——物體，確切的作用——重力，並且牛頓假定了重力的作用是即時的。量子力學在這個定義下無法回答是否超距的問題，是因為它們是模糊的。

如此我們需要給出貝爾對定域性的描述。貝爾認為，兩件足夠遠發生的事件，或者說事實，讓我們設為$A$和$B$，在給出對區域$\Sigma$的物理性質描述$C_{\Sigma}$後，必須滿足以下概率公式：

$$P[A\ |\ C_{\Sigma}] = P[A\ |\ C_{\Sigma},\ B]$$

也即，兩件事件概率不相幹。

如果我們具體地代入 EPRB 佯謬，設$A$事件為「電子的自旋為正」，$B$事件為「正電子的自旋為正」，而$C_{\Sigma}$，如果量子力學是完備的，那就可以設為電子處的完整物理描述，即電子的波函數。易得上式左邊為$50\%$，而右邊則為$0$。但按照量子力學，這裏並不存在所謂的電子的波函數，因為這一對粒子是糾纏的，它們的波函數是一個整體而無法分離！

若修正貝爾的定義，將$C_{\Sigma}$推廣為$\mathcal{C}$，也即，全域(Universe)的物理描述，似乎會更為妥當，這時的$\mathcal{C}$實際也就是兩個粒子的波函數$\Psi$，我們依然能得出上面的結果，也就是，經典量子力學並不滿足定域性。

貝爾接下來做的，是通過一個美妙的不等式展現出：沒有符合貝爾局域性定義的隱變量理論能和量子力學在實驗上保持一致。

有許多種方法可以推出貝爾不等式，我們在這裏采用一種與前述 EPR 相關的。

定義$P(\hat{a}, \hat{b})$為在正負電子的兩個方向測定自旋的乘積的期望，為了方便起見，我們將自旋正規化為$+1$和$-1$。顯然有：

$$P(\hat{a}, \hat{b}) = P_{\hat{a}\hat{b}}(++) + P_{\hat{a}\hat{b}}(—) - P_{\hat{a}\hat{b}}(+-) - P_{\hat{a}\hat{b}}(-+)$$

我們已經知道（很容易從第二節推出），在$\hat{a}$和$\hat{b}$方向夾角為$\theta$時，同自旋方向的概率為$\frac{1}{2}sin^{2}(\frac{\theta}{2})$，異方向的概率為$\frac{1}{2}cos^{2}(\frac{\theta}{2})$。代入可知：

$$P(\hat{a},\hat{b}) = -cos(\theta)$$

接下來讓我們考慮一個帶有局域隱變量$\lambda$的理論，在 EPR 實驗中我們必須保證糾纏的正負電子該隱變量相同，以此來保證它們的關聯是局域的。設電子在$\hat{a}$方向的測量結果為$A(\hat{a}, \lambda)$，同理我們有$B(\hat{b}, \lambda)$。為了使隱變量理論滿足統計力學（以及貝爾對局域性的概率定義），該隱變量一定會有一個在時空中分布的概率密度函數$\rho(\lambda)$。因為這對粒子的糾纏性，它們在同方向的自旋一定相反，自然地，我們有：

$$P(\hat{a}, \hat{b}) = \int\rho(\lambda)A(\hat{a}, \lambda)B(\hat{b}, \lambda)d\lambda = -\int\rho(\lambda)A(\hat{a}, \lambda)A(\hat{b}, \lambda)d\lambda$$

又因為$A(\hat{b}, \lambda)A(\hat{b}, \lambda) = 1$，因此：

$$|P(\hat{a}, \hat{b}) - P(\hat{a}, \hat{c})|\\ = | -\int\rho(\lambda)(A(\hat{a}, \lambda)A(\hat{b}, \lambda) - A(\hat{a}, \lambda)A(\hat{c}, \lambda))d\lambda|\\ = |\int\rho(\lambda)(A(\hat{a}, \lambda)A(\hat{b}, \lambda) - A(\hat{a}, \lambda)A(\hat{b}, \lambda)A(\hat{b}, \lambda)A(\hat{c}, \lambda))d\lambda|\\ = |\int\rho(\lambda)((1 - A(\hat{b}, \lambda)A(\hat{c}, \lambda))A(\hat{a}, \lambda)A(\hat{b}, \lambda))d\lambda|$$

因為$A(\hat{a}, \lambda)A(\hat{b}, \lambda) \in [-1, 1]$，易知：

$$|P(\hat{a}, \hat{b}) - P(\hat{a}, \hat{c})|\\ \le \int\rho(\lambda)(1 - A(\hat{b}, \lambda)A(\hat{c}, \lambda))d\lambda \\ = 1 + P(\hat{b}, \hat{c})$$

此即貝爾不等式。

容易獲知量子力學並不滿足貝爾不等式，取$\hat{a}$與$\hat{c}$夾角為$\frac{2\pi}{3}$，而$\hat{b}$在其角平分線上時，該不等式不成立。事實上，至今所有的量子統計力學實驗都說明了貝爾不等式的不成立，也即是，滿足貝爾不等式的局域性理論無法與量子力學取得一致。

6. 可能性 [possibility]

很多人將貝爾的理論看作是對馮諾伊曼的證明的優化，認為它完全否定了隱變量理論，從而證實了量子力學的正確性。這除了是對玻姆所做工作的忽視以外，也意味著對 EPR 關聯性的忽視。

我們需要將貝爾的工作看做是 EPR 的後續，EPR 證明了，要保持時空的局域性，我們必須引入局域的確定性隱變量理論來和實驗保持一致（回憶第一節引言費曼所說），而貝爾證明了局域的確定性隱變量理論永遠無法和實驗保持一致，按照簡單的邏輯學，我們可以立即推出：時空的局域性是錯誤的！盡管貝爾定理的關鍵在貝爾對局域性的表述正確與否（我們將會在之後探討其他可能性），但當我們重新審視 EPR 與貝爾理論的關聯時，我們似乎不得不將現代物理學的兩座基石之一看作是錯誤的。

貝爾自稱為愛因斯坦的追隨者，因為他在1964年想從局域性的第一原則來推得量子力學。理性的真實否定了這一點，他在其後的講演和論文中甚至暗示了，超距作用——如龐加萊和洛倫茲所假設的那種絕對參考系，甚至是以太，可能真的存在著。與此同時，困擾愛因斯坦的量子糾纏，成功突破思想的牢籠，在應用中展現可能的價值。去年發表在 Nature 的最新實驗物理測量結果甚至表明，亞原子範疇的量子隧道效應(quantum tunneling)是超越光速的。

當然我們可以說，量子隧道，如同德布羅意波是無法攜帶信息有效結構的，但宇宙學突飛猛進的發展，又可能揭示了早期宇宙留下的蟲洞具有超距旅行的潛力。

究竟真實是怎樣的呢？自然會告訴我們這一點，又或是，告訴我們究竟哪些真實可以言說。

7. 對稱群 [symgrp]

沒有運動的物理學一定是不完整的物理學，為了能闡述運動，我們需要獨立於特殊對象，建立起一門關於變換和對稱的科學。數學再一次幫助了我們：群，是一個天然適合表述變換的代數結構。從具體的例子說，設想有一種二維旋轉變換，定義向左為$L(x)$，向右為$R(x)$，先後旋轉的組合運算為$L(x) \circ R(x)$，很容易驗證有以下性質：

封閉：對任意旋轉$g_1, g_2 \in G$, $g_1 \circ g_2 \in G$
單位元：存在$e \in G$，使得$\forall g \in G, g \circ e = e \circ g = g$
逆元：$\forall g \in G, \exists g^{-1} \in G, g \circ g^{-1} = g^{-1} \circ g = e$
結合律：$\forall g_1, g_2, g_3 \in G, g_1 \circ (g_2 \circ g_3) = (g_1 \circ g_2) \circ g_3$

將這個旋轉變換群作用在單位圓上，就會發現經過任意變換後，圓保持不變，這時我們把這個群稱為「對稱群」，這是個十分重要的概念，回想一下洛倫茲變換滿足的矩陣式，事實上，洛倫茲變換對四維的閔可夫斯基度規確實構成了一個對稱群。

以上對旋轉的定義是模糊的，用更精確的矩陣表示這個群，有：

$$R(\theta) = \begin{pmatrix} cos\theta & -sin\theta \\ sin\theta & cos\theta \end{pmatrix}$$

這個定義被稱為$SO(2)$群，它不夠直觀，我們需要一個更本質的定義。驗證發現，所有模為1的復數，加上乘法構成了一個群，這被稱為$\mathcal{U}(1)$群，將上式改寫為：

$$R(\theta) = cos\theta + isin\theta = cos\theta \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} + sin\theta \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$$

它對$\mathcal{U}(1)$群裏的所有元素作用是和$SO(2)$等效的，可以說，兩個群是「同構」的。

擴展到三維，情況就復雜多了，我們可以看到，繞每一個軸都有與二維類似的旋轉矩陣，它們構成的$SO(3)$冗長，復雜又不夠優美，繼續我們剛剛的改寫，這次用四元數代替復數：

$$q = cos\theta + usin\theta,\ u = ai + bj + ck,\ det(q) = 1,\\ i = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}, j = \begin{pmatrix} 0 & i \\ i & 0 \end{pmatrix}, k = \begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}$$

這下好看多了，要保證度規不變，我們定義$v = xi + yj + zk$，使得$v' = qvq^{-1}$。這樣，一個$S\mathcal{U}(2)$群就誕生了，神奇的事情發生了，我們來帶入一個例子：$x$軸單位向量繞$z$軸旋轉：

$$v' = R_z(\theta)vR_z(\theta)^{-1} \\ = \begin{pmatrix} cos\theta + isin\theta & 0 \\ 0 & cos\theta - isin\theta \end{pmatrix} \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix} \begin{pmatrix} cos\theta - isin\theta & 0 \\ 0 & cos\theta + isin\theta \end{pmatrix} \\ = \begin{pmatrix} 0 & e^{i2\theta} \\ -e^{-2i\theta} & 0 \end{pmatrix}$$

多出來的倍數2是怎麽回事呢？這說明對於一個$SO(3)$的元素，有兩個$S\mathcal{U}(2)$元素與它對應，這時我們說$S\mathcal{U}(2)$「覆蓋」(double-cover)了$SO(3)$。當一個對稱群覆蓋了另一個時，我們在之後可以看到，它是更為本質的。

對於有限的變換，我們使用最基本的矩陣表示已經足夠，但如果涉及到連續的，無窮的變換——物理學大多是這樣的，我們就需要一種新形式：「李群」(Lie Group)。運用微積分裏對連續量的思考，我們相似地定義一個無限小量：

$$g(\epsilon) = I + \epsilon X$$

其中$I$是單位元，由此，任意變換都可以認為是無限小量的無限疊加：

$$h(\theta) = \lim_{N\to\infty}(I + \frac{\theta}{N}X)^{N} = e^{\theta X}$$

所有的群元素都由確定的生成元(Generator)$X$構成，因此對於一個李群，只需要確定其生成元和生成元的組合方式（我們一般稱其為交換算子）。這兩樣共同組成的代數結構，就是「李代數」(Lie Algebra)。滿足條件的$S\mathcal{U}(2)$李群的生成元組被稱為「泡利矩陣」(Pauli Matrices)，它們是：

$$\delta_1 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix},\ \delta_2 = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix},\ \delta_3 = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}$$

其他所有生成元可以被認為是它們的線性組合。

讀者讀到這裏肯定已經猜出來了，模為 1 的復數在幾何上表示是單位圓，模為 1 的四元數——同樣的，也是一個四維的球$S^3$！有一個優美的定理：每一個有限維李代數，都只有一個簡單連通的李群（流形）與之對應。如此，我們也可以把$SO(3)$看作是$S\mathcal{U}(2)$的上半部分。

8. 龐加萊群 [poincare]

我們最後要做的工作是，將抽象的對稱群，利用表示論的知識重新轉換到向量空間上。不言而喻，從抽象群到向量空間$V$的轉換必須符合群公理，在這一基礎上，一個非平凡的表示還必須「不可約」，即該表示保證了不存在一個封閉的$V$的子空間。由是利用舒爾引理：

對一個不可約表示$R$，每一個與所有生成元滿足交換律的線性算子$T$都是標量。

我們找到了$S\mathcal{U}(2)$的線性算子$J^2 = J_1^2 + J_2^2 + J_3^2 = 2$，其中只有$J_3$是對角化的：

$$J_3 = \begin{pmatrix} 1 & 0 & 0 \\\ 0 & 0 & 0 \\ 0 & 0 & -1 \end{pmatrix}$$

將它們改寫成特征值表示：

$$J_2 = b(b, m) \\ J_3 = m(b, m)$$

定義兩個操作符：

$$J_\pm = J_1 \pm iJ_2$$

有趣的是，對任意的$J_3$進行這兩個操作符的運算，都會得到新的不同維度的$J_3$，因此它們也被稱為梯子操作符，根據$S\mathcal{U}(2)$群原本的條件列出方程，我們可以看到這些特征值的取值是離散的。

我們知道，所有使得閔可夫斯基度規不發生改變的變換被稱為洛倫茲變換，根據行列式和第一個元素的正負，它們可以被分為四類。用逆時矩陣$\Lambda_T$和逆空間矩陣$\Lambda_P$，我們將洛倫茲群歸為第一種的不同變換（讀者可以自行思考這兩個矩陣的表示）：

$$O(1, 3) = \{L_+^{\uparrow}, \Lambda_P L_+^{\uparrow}. \Lambda_T L_+^{\uparrow}, \Lambda_P \Lambda_T L_+^{\uparrow}\}$$

以上知識已經足夠我們得出洛倫茲群的李代數，篇幅限製，我們直接給出結果：容易驗證旋轉變換$S\mathcal{U}(2)$是滿足洛倫茲變換的條件的，另一「加速變換」(Boost)則通過閔可夫斯基度規的要求$\Lambda^T \eta \Lambda = \eta$得出，這兩個變換並不滿足生成元的交換條件，因此將它們合並為：

$$N^\pm_i = \frac{1}{2}(J_i \pm iK_i)$$

加速變換$K_i$和旋轉變換$J_i$之間的交換關系與旋轉變換本身是一樣的，所以洛倫茲群也覆蓋了$S\mathcal{U}(2)$群。對$N^+$和$N^-$分別賦值泡利矩陣（還記得它是$S\mathcal{U}(2)$的生成元嗎），我們得到了三種表示：

$(0 ,0)$表示，即零自旋表示，用來描述標量粒子，如希格斯玻色子。
$(\frac{1}{2}, 0) \oplus (0, \frac{1}{2})$表示，用來描述旋量粒子，如電子和誇克。
$(\frac{1}{2}, \frac{1}{2})$表示，用於描述向量粒子，如光子。

從變換的對稱性，我們窺見了自然精妙的設計，「自旋」這一基本量的不同，確確實實地描述了所有基本粒子。

最後，給洛倫茲群加上坐標尺度的「平移變換」(Translation)，我們得到了龐加萊群，這已經足夠描述光速不變原理下的所有物理定律。

9. 不變量 [invariance]

平者，水停之盛也，其可以為法也。
—— 《莊子·內篇》

在本系列的第一篇裏，我們介紹了一種改進經典力學的新形式：拉格朗日力學，並提出了作用量的概念。如果我們把這個想法更進一步，考察作用量在變換中的性質，會發現很多有趣的結論。

我們認為在經典力學裏，作用量關於時間的微分為拉格朗日量$\mathcal{L}$，並介紹了它對於速度的微分：廣義動量。這是個比較粗暴的講述，為什麽它被稱為動量呢？

中學裏對動量的定義是$p = mv$，容易看出這就是動能對速度的導數。對於凸函數$T = \frac{mv^2}{2}$，它有以下這個性質：

給定直線族$y=px$，函數$F(p,x) = y - f(x)$在$x=x(p)$時會取得$x$的極值。則$T^*(p) = sup\{F(p,x)\}$被稱為$T$的「勒讓德(Legendre)變換」，這也是原函數的對偶函數（即它們的一階導數互為反函數）。

對動能，我們有$T^*(p) = max\{pv - \frac{mv^2}{2}\}$，$F(p,v)$的極值條件：

$$\frac{\partial F}{\partial v} = p - mv = 0$$

故該斜率即為動量，帶入得對偶函數為：

$$T^*(p) = \frac{p^2}{2m}$$

如果有閑心對該函數再求一次勒讓德變換，可以發現回到了動能式。這個表現的深刻之處在於，它將坐標空間上的對速度的累計動能，成功和相空間上的對動量的累計動能對應了起來（微分幾何上則是切叢和余切叢的關系，在此不作過多表述）。

要考察其在時間變換下的表現，我們對拉格朗日量$\mathcal{L}(q, \dot q, t)$取時間的全微分（乘上虛數單位）：

$$\frac{d\mathcal{L}}{dt} = \frac{\partial \mathcal{L}}{\partial q_i}\dot{q^i} + \frac{\partial \mathcal{L}}{\partial \dot{q_i}}\ddot{q^i}$$

帶入歐拉-拉格朗日方程有：

$$\frac{d\mathcal{L}}{dt} = \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{q_i}}\dot{q^i})$$

我們很容易看到用動量記號$p^i = \frac{\partial \mathcal{L}}{\partial \dot{q_i}}$代換後重定義，原來的拉格朗日量就會轉化成漢密爾頓量$\mathcal{H} = F(p) = p\dot{q} - \mathcal{L}$。它更適合來研究時間變換尺度下的不變性。

要證明作用量在時間變換下的不變，即證明與拉格朗日量對偶的漢密爾頓量，是一個與時間無關的函數，即得出了能量守恒。到了量子力學裏，粒子在場中運動的漢密爾頓方程（E-L 方程的改寫），則是著名的薛定諤方程。

由此推廣地看，不光光是時間變換，平移、旋轉和其他變換都能得到一個自然界固有的不變量，而這也就是下一節所要講述的核心。

10. 諾特定理 [noether]

諾特定理本質上是個微分幾何領域的定理，但從前幾節我們已經或多或少感受出了運動系統和幾何流形之間的關系。偉大的發現往往把看似矛盾的事物聯系在了一起，這條理論物理的中心結論之一就是這樣，它從連續的對稱中發現了一種守恒的關系。

證明這個定理的方法有許多種，但第一步是要形式化它。如果只是說「任意變換對稱性都有一個對應的守恒量」，是不準確的。我們說這句話省略了很多的前提。

延續上一節的框架，我們定義在拉格朗日量$\mathcal{L}(q, t)$下，系統的微分增長為$\mathcal{L}(q + \delta_q, t + \delta_t)$，我們認為系統作用量此時具有對稱性，當且僅當$\delta_S = S(q') - S(q) = 0$。當我們將微分增長用無窮小量表示：

$$q' = q + \delta_q = q + \epsilon \Delta q \\ t' = t + \delta_t = t + \epsilon \Delta t$$

當且僅當$\epsilon$為一趨近於 0 的常量時成立，這時我們稱這系統具有「連續的全局對稱性」。同時，在這個範疇下我們需要一個確定的運動方程（比如 E-L 方程）來完成對稱性和守恒量之間的對應，也即該守恒量是「在殼」(on shell)的。

如此諾特定理的準確表述是：一個離殼的連續全局對稱性具有一個在殼的守恒量$I = p\Delta q - \mathcal{L}$與之對應。

回到第一節介紹的李代數，我有意略去了交換算子的介紹，在這裏，我們將詳細地說明。一個交換算子（李括號）是一種運算，它滿足下列三條規則：

雙線性：$[X, aY + bZ] = a[X, Y] + b[X, Z]$
反對稱：$[X, Y] = -[Y, X]$
雅可比恒等性：$[X, [Y, Z]] + [Z, [X, Y]] + [Y, [Z, X]] = 0$

在李代數對應的李群$G$上定義一組映射$F_t^a : G \to G$，使得它遵守$\frac{d}{dt} F_t^a(b) = [a, F_t^a(b)]$。顯然這組映射就是作用在$G$上的變換。我們可以驗證它很好地滿足了群公理。

對於變換滿足的條件$F_t^a(b) = b$，我們說$a$產生了連續的全局對稱性，同時，$b$也自然是一個守恒量，現在我們要證明，$b$對該系統也具有連續的全局對稱性，即$F_t^b(a) = a$。

對等式取微分即：

$$\frac{d}{dt}F_t^a(b) = [a, F_t^a(b)] = 0$$

在不變換的情況下，即使$t = 0$得：

$$[a, F_0^a(b)] = [a, b] = -[b, a] = 0$$

即$F_t^b(a) = a$證畢。諾特定理成立。

11. 附錄：歐拉-拉格朗日方程的推導 [appendix1]

我們的目標是尋找 $$S = \int_{t_1}^{t_2}\mathcal{L}(x, \dot{x}, t)dt$$ 的極小值，設極小分量$\epsilon(t)$，即使得

$$S' - S = \int_{t_1}^{t_2}(\mathcal{L}(x + \epsilon, \dot{x} + \dot{\epsilon}, t) - \mathcal{L}(x, \dot{x}, t))dt = 0$$

對$S'$進行泰勒展開

$$\mathcal{L}(x + \epsilon, \dot{x} + \dot{\epsilon}, t) = \mathcal{L}(x) + (x + \epsilon - x)\frac{\partial \mathcal{L}}{\partial x} + (\dot{x} + \dot{\epsilon} - \dot{x})\frac{\partial \mathcal{L}}{\partial \dot{x}} + ...$$

由於在$S$處取得極值，故我們舍棄二次以上項得

$$\int_{t_1}^{t_2}(\epsilon\frac{\partial \mathcal{L}}{\partial x} + \dot{\epsilon}\frac{\partial \mathcal{L}}{\partial \dot{x}})dt = 0$$

由分部積分得

$$\int_{t_1}^{t_2}dt\dot{\epsilon}\frac{\partial \mathcal{L}}{\partial \dot{x}} = \epsilon\frac{\partial \mathcal{L}}{\partial \dot{x}}\biggr\rvert_{t_1}^{t_2} - \int_{t_1}^{t_2}dt\epsilon\frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}})$$

由於固定了起點和終點，因此我們有$\epsilon(t_1) = \epsilon(t_2) = 0$，代入得

$$\int_{t_1}^{t_2}dt\epsilon(\frac{\partial \mathcal{L}}{\partial x} - \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}})) = 0$$

由雷蒙引理(Du Bois-Reymond lemma)

對$[x_1, x_2]$上的連續函數$f(x)$和無窮小量$\eta(x)$，若$\int_{x_1}^{x_2}\eta(x)f(x)dx = 0$且$\eta(x_1) = \eta(x_2) = 0$，我們有$f(x) = 0$。

故

$$\frac{\partial \mathcal{L}}{\partial x} - \frac{d}{dt}(\frac{\partial \mathcal{L}}{\partial \dot{x}}) = 0$$

即歐拉-拉格朗日方程成立。

12. 附錄：艾米·諾特的生平 [appendix2]

Her courage, her frankness, her unconcern about her own fate, her conciliatory spirit were, in the midst of all the hatred and meanness, despair and sorrow surrounding us, a moral solac.
— Hermann Weyl

艾米·諾特(Emmy Noether)出生於巴伐利亞州一個普通的中產猶太家庭。1900年，18歲的諾特從一所中學畢業，並獲得教師資格，在當時，富有的中產小姐在中學教授英語和法語被認為是一項體面的工作，但諾特卻放棄了這個機會，她決定就讀埃爾朗根大學。

諾特一開始被允許旁聽數學系的課程，1904年正式成為學生。在哥爾丹的指導下，她花費三年時間獲得了博士學位，研究方向是代數不變量。她計算出了三百多個不變量，並在數學界獲得了良好的反響，盡管在之後，她並不滿意自己的成果，認為它們是毫無意義的。

諾特隨後在母校無償教授了七年的數學。1915年，受希爾伯特的邀請來到哥廷根。按照普魯士法律，女性並不能獲得教職，面對諸多質疑，希爾伯特做出了著名的回擊：「我們畢竟是一所大學，而不是一間澡堂。」在這段時間裏，諾特證明了關於守恒量的定理，並由克萊因代為在皇家科學院發表。

1918年，看到諾特研究的愛因斯坦寫信給克萊因：「在閱讀了諾特小姐的研究後，我再次為她沒有教職而感到不公。」在希爾伯特的名義下開設講座四年後，諾特終於獲得了一個依然無薪的教職，可以自己教授學生。一戰以後的飛速通貨膨脹讓她的生活十分艱難，但她並不在乎這點。

諾特在隨後的十三年中對純粹數學做出了巨大貢獻，她對環的理想做出了準確定義，並在1928年看到了交換代數和拓撲學之間深刻的聯系，因此被認為是代數拓撲的奠基人之一。她喜歡在授課時與學生討論，許多重要發現也是因此做出的。

1933年，諾特由於猶太人身份被哥廷根解雇，在她曾經門生韋伯的鼓吹下，學生們開始向校內「反德意誌精神」勢力發起攻擊，哥廷根大學的數學中心地位自此失去，希爾伯特在面對納粹教育委員會提問時回答：「哥廷根的數學？再也沒有了。」

諾特在美國一所女子學院度過了生命中最後兩年，1935年，她在治療卵巢囊腫的術後感染中去世。她被認為是二十世紀最為重要的數學家之一。如同許多同時代的女性一樣，她用天賦、熱情和創造力向我們證明了，真理永遠獨立於身份之外。

參考資料

J. Schwichtenberg, Physics from Symmetry(2nd Edition), Springer, 2018.
Prof Kenneth Young on A Special Lecture: Principle of Least Action, The Chinese University of Hong Kong.
林琦焜, 最小作用量原理, 數學傳播 35卷1期, 2009.
Ghirardi, Giancarlo and Angelo Bassi, Collapse Theories, The Stanford Encyclopedia of Philosophy, Edward N. Zalta (ed.)
J.S. Bell, Against ‘Measurement’, reprinted in Speakable and Unspeakable in Quantum Mechanics, 2nd edn. (Cambridge University Press, Cambridge, 2004)
J.N. Shutt, Determinism, locality, and meta-time, 2008
T. Norsen, Foundations of Quantum Mechanics, (Springer, 2017)
J. Baez, Getting to the Bottom of Noethers Theorem, 2018.
D. Stretch, Emmy Noether: Against the odds, 2000.