王孟源:為什麼國際物理界沒有太重視悟空的這次發現
【文/ 觀察者網專欄作者 王孟源】
【編者按:中國暗物質探測衞星“悟空”近期宣佈了新的科學發現,國內外媒體對此有不同表述,有些媒體稱“可能發現了暗物質”,並視其為重大科學成果,但也有一些媒體採用了更加謹慎的表述。物理學界對“悟空”最新成果也各有評價,本文僅僅是作者的一家之言,雖是質疑,但其出發點是關心而非貶低中國的科技進展,觀察者網堅持百家爭鳴的態度,歡迎學者和讀者都來參與討論。****】
物理界在1880年代就提出暗物質的猜測。一開始是因為銀河系外圍恆星的切向飛行速度太快,銀河系核心被觀測到的質量遠遠不足以提供所需的向心力。後來在20世紀發現同樣的問題也出現在更大的尺度上,星系團(Galaxy Cluster)和超星系團(Supercluster) 外圍成員的切向飛行速度也是數倍於核心重力能維持的範圍。如此一來,只有兩個邏輯可能,第一是每個星系(Galaxy)都有大量不參加強作用力(否則會與原子核有反應)和電磁力(否則會與電子和質子有反應)的暗物質;第二,是廣義相對論的重力方程式在星系以上的尺度必須有新修正項。
近年來,用各種間接手段觀測到的暗物質重力效應越來越多,要靠修改重力方程式來滿足所有的觀測結果也越來越難自圓其説,所以暗物質就成為天文物理界的主流理論。2017年11月有兩篇論文引起了學術界專家的注意和廣泛討論,剛好就是有關這個話題;一篇似乎是對的,另一篇則似乎是錯的。
頭一篇是UC Berkeley的Katelin Schutz在11月9日發表的論文:經過觀測和研究,證明暗物質的重力效應,至少在銀河系內是完全球對稱的(Spherically Symmetric)。因為銀河系的可見物質成碟狀分佈,如果暗物質的重力效應其實來自重力方程式的變形,那麼應該也會看到碟狀而不是球狀的現象,所以這個新結果又再一次偏愛(Favor)了暗物質的存在。
另一篇是University of Geneva的教授André Maeder在11月27日發表的理論,是廣義相對論重力方程式的又一個新的變形。但是隨即遭到好幾個物理博主的無情反駁(參見Sabine Hossenfelder在11月30日的總結:http://backreaction.blogspot.com/2017/11/if-science-is-what-scientists-do-what.html ),基本上已經確定是錯的。
至於中國的悟空衞星,在11月30日發表於《Nature》的論文,號稱在1.4TeV的能階上可能發現了暗物質衰變產生的電子,雖然被中國官方廣為宣傳,不但充斥於中文媒體,英文的大眾媒體也多有報道,但是如此驚人的結果,物理專業的博客卻對它基本無視,既沒有慶祝也沒有反駁,《Nature》自己的網站也沒有出新聞報道,這是為什麼呢?

前面提過,暗物質理論來自對重力現象的間接觀測結果;它不可能參與強作用力和電磁力,否則必然早已被直接觀測到。但是宇宙中還有第四種作用力,也是弱作用力;它太過微弱,所以暗物質是否參加弱作用力,目前的實驗和觀測很難完全排除其可能。其實客觀來説,希望很小,這是因為量子效應會在較低的能階也留下蛛絲馬跡,人類的對撞機已經做到13TeV的能級,卻完全沒有看到任何這類的量子修正項,代表着在1TeV、10TeV、乃至100TeV的能級上,暗物質都不太可能有弱作用力的效應。如果理論非要硬拗不可,當然也做得到,只須要多加幾十個、乃至幾百個自由度,或者硬是假設精度極高的參數(例如弱作用反應項的係數被設定為0.00001),但是這些做法都是失敗理論的特徵,嚴重違反了Occam’s Razor。
美國的實驗學家為了取得政府巨資(雖然悟空的造價宣稱只有1億美元,即7億人民幣,但與悟空衞星類似的AMS-02可花了20多億美元,亦即130多億人民幣)來花,就不能太清楚解釋這一點,而必須假裝暗物質參加弱作用力(叫做“WIMP”假設,Weakly Interacting Massive Particles)是個有根據的結論。剛好超弦的基本假設,也就是超對稱,天然就會產生WIMP,於是裏應外合,高能物理的理論和實驗界都眾口一詞,把WIMP假設吹噓成主流理論,在過去十年裏催生了許多個昂貴(即百億人民幣級)的實驗,專門要測量WIMP。這些WIMP實驗又分成兩類:第一類是在很深的地下,用大量同位素穩定(亦即沒有會自發衰變的同位素)的介質,藉以觀察其原子核與WIMP直接進行弱作用力反應,例如美國的LUX實驗和中國版Panda X。第二類則是用衞星來測量WIMP在銀河系空間中因弱作用力而自行衰變產生的正子和電子對,例如美國的AMS-02和中國版悟空衞星。
所以悟空衞星實際上是一個專門測量宇宙線中的正子流和電子流的儀器。但是因為銀河系到處都有磁場,電子和正子在被截獲之前,已經轉過許多彎了,所以不可能知道它們的發源方向。那麼唯一能測量的,只是它們的能量。結果全世界幾百個博士,花十年時間和百億元,所得到的,也就是下面這張圖:橫軸是能量,縱軸是觀測到的電子流密度。然而,宇宙中能產生電子和正子的機制太多了,根本不可能精確計算背景信號曲線,所以最後只能籠統地看看測量結果的曲線是否平滑。

DAMPE是悟空衞星計劃的英文名字,AMS-02和Fermi都是美國較早發射的衞星。這次悟空衞星團隊宣傳的結果,就是在圖中紅線右端沒有平滑過渡的一高一低兩個點,分別對應着1.4TeV和1.2TeV的能量。但是有三個疑點:1)Fermi衞星(圖中的藍線)也涵蓋了相關的能階,卻沒有看到類似的現象;2)這個結果出現在電子流(縱軸)很低的尾端,剛好對應着較少的統計樣本和較低的統計意義;3)這兩個偏離平滑曲線的點,偏離的程度只有兩個統計標準偏差左右,距離物理界傳統上要求的五個標準偏差很遠,連“有趣”都談不上。
一般統計方法假設高斯分佈(Gaussian Distribution),兩個標準偏差對應着名義上(Nominally)4.5%的統計噪音機率(亦即有4.5%的機率這個結果是因統計樣本不足而隨機產生的噪音)。五個標準偏差則精確到0.00006%。為什麼物理界會要求如此高的統計精確度呢?
這有很多原因,和我們眼前話題有關的有三個:1)實際的隨機分佈往往不遵循高斯分佈,而有不能確定的胖尾巴(Fat Tail),使得統計噪音被低估。2)兩個標準偏差對應到4.5%的噪音,是假設只有一個數據,像上圖這條紅線總共有38個數據點,那麼隨機出現兩個標準偏差數據的機率就是(1-(1-4.5%)^38)=83%;換句話説,沒有偏離的現象才算奇怪。這在物理界叫做“Look Elsewhere Effect”;也就是人類天性就會專注在“特別”的數據點上,而忘記有多少“普通”的數據點被嘗試過了。所以要求五個標準偏差,即使有10000個“普通”的數據點被忘記,實際上統計噪音仍然只有(1-(1-0.00006%)^10000)=0.6%,還在可接受的精度內。3)這種簡單的標準偏差估算,還有另一個隱性的假設,就是橫軸的測量是絕對精確的,統計誤差只存在於縱軸。可是電子流密度的測量,最大的誤差其實是在能級上;換句話説,這張圖的橫軸誤差實際上比縱軸誤差還大,有少數幾個1.2TeV的樣本被測量成1.4TeV,就自然會有一個1.2TeV的低點和一個1.4TeV的高點。這是統計噪音又被低估的另一個原因。
正是因為悟空衞星結果的實際統計誤差太大,缺乏統計意義,所以國際物理界不把它當回事。但是悟空衞星團隊不止事後是拿一個沒有實際統計意義的結果來過關,而且是原本設計就有問題。我這麼説,是因為暗物質如果真的衰變,會產生同樣數量的正子和電子;但是在1TeV左右的能級上,宇宙線中電子流的背景比正子流高20倍,所以AMS-02發表結果的時候,專注在正子流而不是電子流上,正是緣於前者的信噪比是後者的20倍。悟空衞星團隊反其道而行,為了追求稍高一點的能級,犧牲了分辨正子和電子的能力,原本對WIMP的解析力就弱於早上三年的AMS-02,難怪這次只能拿出統計噪音來當結果。(本段根據讀者意見稍作修訂,在此深表歉意和感謝。)
實際上,WIMP和它所依據的超對稱理論,從1986年的Ginsparg & Glashaw論文揭露真相開始,大多數的高能物理學家就知道不靠譜(例如2000年有行內的賭盤,結果賭LHC不會發現超對稱的佔70%),偏偏一些學者在美國超弦界影響下,依然堅持做超對稱實驗,兩年前的Panda X和這次的DAMPE不但都如有識之士早已預見的做了虛功,而且是美國實驗的重複投資,即使誤打誤撞中了彩票,也只會是追救護車之舉。因為比起美國稍早的版本,它們只多出一點點功能,而美國實驗在設計的時候,就已經尋求效費比的最大化,所以名義上的多出來的那一點功能,實際上的物理意義是有限的。
例如這次悟空衞星,犧牲了壽命來追求高一點點的能階。但是高能級的統計誤差本來就大,再犧牲了壽命之後,就不太可能有足夠的統計樣本來得到確實的新結果。換句話説,Panda X和悟空衞星都是在投資上並不明智:不但找到信號的機率很低(小於0.1%),就算有信號,美國實驗也大概率會先找到。美國人找不到而中國找到的腳本,很可能不會發生。
相比之下,前面提到Katelin Schutz真正推展了人類對暗物質的瞭解,所用的卻只是幾台簡單的個人計算器。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。