奇思妙想得到的科研靈感,卻難以寫進論文裏_風聞
返朴-返朴官方账号-科普中国子品牌,倡导“溯源守拙,问学求新”。1小时前
編者按:本文繼續夜間科學的探索(此係列文章參見文末相關閲讀)。在這篇文章中,作者闡述了科學的兩種語言,一種即嚴謹精準的日間科學語言,是經科研工作長期訓練習得的,用於論文寫作、學術交流;另一種是使用隱喻和擬人化的夜間科學語言,隨意而有創造性,能為研究對象帶來直觀的理解。兩者都是科研中不可或缺的,但後者並不會被正式表達出來,甚至在學生時期被禁止使用。而對於中國科研工作者來説,“現代科學”本身即舶來品,且中文博大精深,或許已經模糊了兩者的界限,因此去了解並使用術語之外的夜間科學語言,對幫助我們激發科研靈感有實際意義。
撰文 | Itai Yanai、Martin Lercher
翻譯 | Kestrel
“如果我們允許自己以一種特許的方式談論基因,即彷彿它們擁有刻意的目的,同時我們又有把握,在必要時可以將我們使用的略為隨意的語言還原為正規的術語,那我們就可以提出這樣一個問題:一個自私的基因究竟想做什麼?”
——理查德·道金斯(Richard Dawkins),《自私的基因》p.88
“我把系統1和系統2擬人化為行動者(agent),因為比起抽象的分類,人們更容易思考具有行為傾向和特徵的行動者。行動者之所以能成為強大的研究對象,因為它們活靈活現,而且就是這麼做事兒的。”
——丹尼爾·卡尼曼(Daniel Kahneman),私人通信
現代科學在認識世界方面取得的驚人成就,很大程度上根植於其嚴謹的結構:科學家們清晰地闡明假設,設計含有恰當對照的確證性實驗,並運用統計方法評估研究結果的可信度。這些過程形成了弗朗索瓦·雅各布(François Jacob)所稱“日間科學”的核心。為了發揮這些優勢,我們在論文手稿和會議報告上描述我們的工作時,會採用一種高度精確且避免隱喻的語言。掌握這種語言是我們成為日間科學研究者正式訓練的重要環節。然而,科學還有同樣重要的第二種語言,它鮮有被明確教授,而且常常被忽視。這就是“夜間科學(night science)”的語言——我們工作的創造性部分,在這裏我們構想出原初的、模糊的,也是後面要用日間科學來驗證的猜想。在夜間科學中,堅持精確反而變成一種阻礙,而隱喻和擬人化(anthropomorphizing)——對非人對象,例如細胞、蛋白、基因進行人格化,將賦予我們探索未知的強大直覺。一旦我們在夜間科學探索中確定了一個想法,我們可以將它翻譯為規範的日間科學語言,從而利用手中嚴格的日間科學工具設計並執行實驗。為了避免誤解,我們在交流時必須明確區分涉及到的夜間科學語言。但是將這種語言作為日間科學規範語言的補充加以培養,是我們成長為富有創造力的科學家的重要階梯。
不要擬人化基因,它們不喜歡
“我們是生存機器——是為保存我們的自私分子(即基因)而被盲目編程的機器人運載工具”。當這句話最初被理查德·道金斯寫在《自私的基因》的前言時,它是令人震驚的。難道有人會真的覺得基因具有人類的特點,比如自私,或者有編程出物或人的能力?這種擬人化——將人類的特點或意向賦予非人個體——本就不是按字面意思來理解。道金斯很清楚基因不會真的是自私的,真這樣想就太荒謬了。但它的擬人化語言創造了一個強大的、引人入勝的意象,形象地展示了基因在演化過程中的核心角色。
人類語言中的隱喻俯拾皆是(chock-full):據估計,為了捕捉(capture)到我們戰友(brothers in arms)的想象力,我們每分鐘都會部署(deploy)幾個隱喻(前面這一句中有四個)。擬人化是一種特殊的隱喻,在科學家間的非正式交流中尤為普遍。同時,許多科學家認為它們不適合出現在科學討論中,主張隱喻和擬人化是屬於詩歌的領域,而科學是嚴謹與精確的國度。我們被教導,把一個基因説成是“自私的”,可能導致訊息誤傳和理解偏差。確實,有人認為微生物學中關於“微生物間戰爭”的擬人化描述已經誤導了科研,妨礙了科學家理解“抗菌”小分子分泌的多元功能。其結果是,老師們教我們思考或者談論生物學的時候不要去擬人化,許多學生的作業就曾被他們的教授判了死刑,並用紅墨水留下墓誌銘般的批註“不要擬人化!”
反對在科學中使用擬人化表述的理由簡單而直接:基因、蛋白質和細胞不會“感覺”或者“想要”任何東西,它們不是受意圖驅動的,而是基於物理和化學的力量來運動和變化。擬人化思考是兒童早期推理的典型特徵,而理解無生命“行為”背後的根本原因,是表現心智成熟的重要一步。既然如此,為何擬人化表述在非正式科學思考和討論中仍然無處不在呢?它們並非侷限於生物學,可以説是遍及所有科學分支;在人工智能研究中尤甚,甚至有人説它們“往輕了説誤導認知,往重了説極其危險”。擬人化語言到底是我們應該努力去根除的壞習慣,還是要為其好用的地方辯護呢?
意向本能
人類這種動物,其決定性的特徵就是我們對社會結構和社會交互的依賴。我們演化的整個過程中,高度的社會認知是至關重要的:一方面,我們的生計常常有賴於羣體內的合作;另一方面,大部分史前人類死亡事件被認為是由其他人類造成的。甚至到今日,為了合作並偶爾與他人競爭,我們必須以合理的速度和準確性理解並預測他人的行為。我們的大腦通過採取一種“意向立場”(intentional stance),運用一種“心智理論”(theory of mind)來達成此目的:我們推斷他人的信念、慾望和意圖,並據此預測相應的行為[注1]。所以有理由認為,人類大腦已經在自然選擇的壓力下進化了,這種選擇壓力基於預設他人的意圖,偏好快速、直覺性地預測其行為。
這種觀點有神經科學研究的支持。我們身體的大部分能量預算被大腦消耗掉了,而大腦消耗的大部分能量,即使是明顯處於靜息狀態,也是用於維持身體的自發活動(即維持穩態)。表現出活動能量消耗最大的腦區,與我們採取“意向立場”時活躍的腦區重合。功能磁共振成像(fMRI)研究甚至表明,這些腦區的自發性活動會預激活大腦,當問題出現時大腦就能快速採取一種意向立場。
因此,我們的大腦可能已在演化過程被優化,以處理基於意圖框架的信息。這樣的特化可以類比GPU,它是專門為處理圖形類信息而優化的,但也可以被重新用於任何能轉化成數學上等價形式的問題上。當我們處理沒有傾向性的信息時也會直覺性地採取意向立場,例如弗裏茨·海德(Fritz Heider)和瑪麗安·西梅爾(Marianne Simmel)的動畫[注2],裏面有兩個三角形和一個圓形,它們都可以移動(圖1)。當人們被要求描述他們在動畫中所看到的內容時,許多人會講一個關於這些幾何對象的動機和情感的故事。似乎人類的天性,就是會去用隱喻語言和擬人化手法講故事——儘管從科學家做科學研究的視角來看,這可能是不合適的。事實上,心理學實驗顯示,當人們被引導去為手上的任務構思隱喻或類比時,他們能夠更快地解決問題。
圖1 Heider-Simmel動畫。一部裏面有兩個三角形和一個圓形的動畫短片,會引導我們講一個充滿動機和目的的故事。
兩種語言
科學重視精確性的理由顯而易見:嚴格驗證觀點的能力是對非邏輯性思維的一次偉大勝利。雖然人們可以提出任何關於自然的論斷——聲稱水具有記憶,斷言星辰的方位能預示個人命運的走向,或是相信“每日一蘋果,醫生遠離我”這樣的老話,但科學有手段驗證這些假説並丟棄那些沒有通過驗證的假説(即證偽)。並且為了確保檢驗過程在邏輯上站得住腳,我們必須用精確的、不含隱喻的語言來表述待檢驗的假説。
描述假説檢驗所要求的日間科學語言,幾乎是科學手稿中唯一使用的語言,我們以一個假説開始,對其作出合理解釋(通常是事後才明白),然後着手驗證它。在學術會議上,我們用日間科學的語言試圖説服同行們接受我們的發現。在基金申請中,當我們要為一個重要假説撰寫嚴格的科學方法時,日間科學的語言走向了舞台中央。它也是期刊俱樂部和論文評審採用的獨家語言,對一個科學論斷的驗證迫使我們對基本假設提出嚴格質疑,看看它是否經得起挑戰。
儘管日間科學的語言有助於科學思想的精準表述和驗證,它並不是特別適合於新觀念的創造。作為人類,我們需求一種可以發揮直覺的語言——一種讓我們對現象有“感覺”的語言。這就是夜間科學的語言。在夜間科學語言中,我們可以自由地擬人化,幫助我們理解某個現象為什麼以及如何發生。夜間科學語言不是精確的,但我們犧牲嚴謹性的同時,獲得了直覺性。我們問“那個有機體想要什麼”的時候,我們身臨其境地站在基因的視角思考,琢磨在給定條件下一個基因組的最佳策略是什麼。
夜間科學語言看似犯了一個錯誤——將慾望和意圖強加於基因、蛋白質和細胞等非人類個體。儘管這種語言看起來不準確且具有誤導性,但在許多情況下它就是嚴謹的日間科學語言的簡略表達方式。用夜間科學的擬人化術語表達的科學陳述,可以重新轉化為日間科學的語言。表1給出了一些例子,其中一個取自我們所著的《基因社會》(The Society of Genes),我們寫出過“癌基因的目的是爭取一種不公平的優勢”。當然,一個基因並不會嘗試去做任何事情——基因就是基因而已。我們的意思可以更嚴謹地重新表述為“原癌基因發生突變後,若導致攜帶該突變的細胞增殖速率增加,隨着時間推移,攜帶該突變的細胞在身體總細胞中的佔比會增加。”當我們用夜間科學語言表達這一概念時,我們知道我們可以將其翻譯回原來嚴謹的日間科學語言。不過,通過想象癌基因有意圖,我們獲得了關於其參與的生理和演化過程的直觀理解,而這能幫助我們更快、更深入地思考腫瘤發生機制。夜間科學語言契合了我們大腦回路的一種特殊偏好,它依託大腦中那套久經磨礪且運作嫺熟的意圖識別能力,並基於此作出預測。

表1 將夜間科學的語言翻譯成日間科學的語言
在日間科學和夜間科學兩種語言之間,你自己或者同事會問的典型問題可能存在質的不同(見表2)。為了在生物學中應用意向立場,並利用我們大腦基於預測意向行為的能力所建立的直覺,你就應該問出那些可能在日間科學中聽起來傻傻的問題。如果你是這個蛋白質,你的目標是什麼?如果你是那個細胞,你會用特定的調控模式實現什麼?這樣的語言不僅缺乏嚴謹性,甚至可能產生誤導——基因、蛋白質和細胞當然不是具有信念和慾望的理性主體。但這就是夜間科學的天性:不拘一格,只要它有可能為你提供關於某個系統的寶貴觀點。那些觀點經過日間科學的檢驗後,可能被證明是完全錯誤的,但在這個過程中,我們可能會發現關於該系統潛在機制的重要信息。尤其對普羅大眾而言,夜間科學語言可以讓他們建立一種對科學議題的直覺;這就是為什麼擬人化表達和其他隱喻在科普文獻中如此普遍。若沒有經過科學訓練,這樣的直覺本身並不容易轉譯為精確的日間科學語言,但它傳達的理解力是十分強大的。
表2 兩種科學語言中的不同問題
當然,將科學劃分成兩種語言——夜間科學和日間科學——本身就是一種類比:兩種語言都用同樣的詞彙和語法。但它們在思維模式上截然不同,也許正如斯諾(C. P. Snow)抱怨的,人文科學和自然科學是“兩種文化”。保持這兩種語言之間的分野理由充分,即強調觀念的產生與後續的驗證之間的區別。這種區別正是現代科學的標誌性特徵。相反,鍊金術士通常不去分清日間科學還是夜間科學。他們相信在隱喻的背後有更深層次、更基本的真理存在,從而模糊了隱喻關係與真實關係之間的界限。由於未能清晰地區分想法(idea)和驗證(test),他們的科學探索受到了嚴重阻礙。
發現的語言
夜間科學語言不單單有助於我們對複雜概念形成直觀理解。對某些重要的新思想的產生,它更是不可或缺的,因為不是每一個隱喻性的夜間科學想法,正如表1所示的那樣,都可以從一開始就能一對一地被翻譯為精準的日間科學語言。一個真正的新思想初具雛形的時候,可能都還沒有恰當的詞彙來形容它。為了讓這個想法可以被證偽,即可以被日間科學驗證,它需要不斷被重塑和精煉,而最初我們唯一能憑藉的,正是那種不精確卻直觀的語言(圖2)。
圖2 科學的兩種語言。夜間科學中提出的想法,最初是以擬人化和其他隱喻形式表達的,可能朦朧模糊、不完全成形,但最終可以轉化成精準的日間科學語言。
舉個例子,我們來看看“自私的基因”這一説法,以及這種擬人化的語言如何促成了基因組內“超自私元件”的發現。既然有機體只是一個“生存機器”,一個基因可以“選擇”變得自私,不給有機體的適合度提供任何有用的貢獻。這個概念導致了自私DNA的發現:這類基因能夠通過一種複製機制確保其在基因組中的存續,而不為有機體增加額外功能。轉化成日間科學語言,這一概念已經隨着轉座元件(transposable element)的識別和界定得到充分驗證。當然,它們也可能會獲得對整個基因組適合度有益的新功能,但這點不應掩蓋其作為純粹自私元件的起源。
另一個能體現夜間科學語言有助於科學發現的例子,來自我們最近發表的一項研究的探索歷程。團隊成員夏波使用單細胞RNA測序方法,生成了一個細胞在精子發生(spermatogenesis)期間的基因表達數據集。我們發現了幾千個在減數分裂後表達的基因,這個時候基因組是單倍體的[注5]。在一次討論中,我們當中有人想起一個觀察結果,即任何基因都可能在睾丸中表達,但原因尚不明確。我們注意到,在這種脆弱的狀態下,打開(turn on)這麼多基因對生殖細胞來説是很瘋狂(crazy)的事情,因為轉錄過程可能導致原本意在(intend)成為下一代遺傳基礎的DNA遭受不可修復的損傷。這引導我們思考,或許細胞想要(want)更多突變,因為遺傳多樣性是演化適應的引擎。於是我們決定通過交叉比對我們的數據集與已知人羣中的DNA變異情況,來驗證這個爭議性的觀點。跳回到日間科學,夏波進行了分析並得到了與預期相反的結果——在精子發生期間表達的基因,並不比未表達的基因產生更多突變,實際上突變更少。然後我們意識到,細胞可能還是想要那些基因少些突變。最後,我們發現了轉錄偶聯修復機制可能在起作用的證據,並且推測雄性睾丸中廣泛的基因表達,或許是專門通過我們稱為“轉錄掃描(transcriptional scanning)”的過程來校正突變[注6]。儘管像“細胞想要產生或者校正突變”這樣的擬人化語言不準確,但它給了我們一種對系統的直觀認識,將我們引向最終的發現。
在最近發表的另一篇論文中,Hugo Dourado為分析最優細胞經濟(economy)體系建立了一個理論框架[注7]。雖然這個理論的最終數學形式是純粹的日間科學,但科研過程是受到一些夜間科學問題驅動的,諸如細菌細胞想要什麼——它們想要快速生長(因為生長速率與適合度相關),然後我們推測它們通過某種方式調節(adjust)其組分濃度來達成(achieve)這一點。再一次地,我們需要回到日間科學來證明這個直覺是對的,通過求解相應的方程,並將我們的預測與不同蛋白質濃度對生長速率的依賴關係進行觀察比較。
迷失在翻譯中
《自私的基因》可能是有史以來最飽受誤解的書之一,它的擬人化標題難辭其咎。在公開活動中,道金斯曾多次回應“DNA片段何以能被稱為自私”的質疑,指出提問者顯然未閲讀該書標題的腳註,更別説整本書了。在該書的30週年紀念版的前言中,道金斯甚至直言他後悔用了擬人化的標題——早知道就該聽從友人的建議,把書名定為《不朽的基因》。但這並非他的真心話。《自私的基因》為讀者提供了一種直覺,關於如何將基因作為自然選擇的中心靶點來思考,進而將其看作地球生命故事的推動者。
所以,為何擬人化招致如此多麻煩事呢?如果我們能清晰地區分夜間科學領域和日間科學領域及其對應的語言,其中的一大部分麻煩事便可化解。正如反覆強調的那樣,如果我們將擬人化帶入日間科學的世界,混淆和誤解就可能出現。如果我們決定在一場科學演講或者一篇期刊文章中冒險使用夜間科學語言,我們就離開了默認的日間科學模式。為了不讓我們的聽眾感到迷惑,我們應該明確地指出我們正在涉足夜間科學的領域,而我們要説的所有事情都可以翻譯成嚴謹的日間科學語言——如果確是如此。
反過來,如果在夜間科學的討論中不斷堅持使用日間科學的語言,也會惹人惱火。當我們的大腦在其創造性模式下工作時,不應該指望我們去用精確的語言描述一個僅僅處於孕育之初的想法;還沒有到統計學和控制變量等日間科學手段登場的時機。例如,當你以夜間科學語言談論一個癌細胞想要如何以某種特定策略進行免疫逃逸時,你要是聽到對話者回復説,“你知道的,細胞並不會真的想要任何事情”,那你奔湧的思緒可能就戛然而止了。
我們的科學訓練是以日間科學的語言進行的:通過它的術語,我們學習如何設計帶有陰性對照和陽性對照的實驗,如何發現隱藏假設,以及如何運用恰當的統計學。這種模式可能讓我們誤以為這是科學唯一合適的語言。但學習夜間科學的語言同樣重要,在其中我們嘗試從研究對象的有利視角去看世界——一個基因,一個蛋白質,一個細胞——然後問“它想要什麼?”在我們想要建立直覺的地方,夜間科學語言總有其位置:利用我們大腦的連接方式,採取意向立場,根據推斷出的信念和意向,我們去預測研究對象會發生什麼。許多情況下,夜間科學模式下思考和發言可能更接近丹尼爾·卡尼曼所説的“快思考”,依託本能啓發法,充滿直覺和感性;而清醒嚴謹的日間科學則更接近深思熟慮、富含邏輯的“慢思考”模式。我們兩種模式都需要,而科學家們告誡他們的學生不要去擬人化(而不是告訴他們什麼時候(when)要去擬人化)可能是不利於科學發展的。夜間科學語言開啓了快速、直覺性探索的潛力;在其當中我們皆成詩人,讓科學更美好。
譯者注
[1] “意向立場”是由認知科學家丹尼爾·丹尼特(Daniel Dennett)提出的概念,是指通過賦予某個行為主體以信念、知識等認知狀態來解釋其行為,並據此預測其行動的闡釋策略。“心智理論”也是認知科學中重要的概念,指能夠理解自己和他人擁有不同的心理狀態的能力,由心理學家大衞·普雷馬克(David Premack)和蓋伊·伍德拉夫(Guy Woodruff)於1978年提出。簡單來説,擁有心智理論意味着你能夠站在別人的角度思考問題,去推斷他為什麼會這麼做。
[2] 1944年,兩位社會心理學家弗裏茨·海德和瑪麗安·西梅爾通過一個簡單的動畫短片發現,絕大多數觀看者會自發地、不可避免地賦予這些幾何圖形意圖、情感和社會角色(如欺凌者、受害者),並構建出連貫的敍事故事(如:大三角在欺負小三角和圓圈,小三角想保護圓圈,它們一起努力逃脱了大三角的追捕)。這一經典實驗深刻揭示了人類固有的、自動化的擬人化傾向和社會認知模式,即我們傾向於將運動解釋為有目的的社會行為並歸因於內部特質。這一觀點成為歸因理論和社會認知研究的基石,並對動畫、設計等領域產生了深遠影響。
[3] 這是氨酰-tRNA合成酶催化氨酰化反應的關鍵步驟,即確保將正確的氨基酸精準地“掛”在其對應的tRNA上。在酶的催化下,異亮氨酸與ATP結合後,形成中間體異亮氨酸-AMP,此時酶的活性位點會“封閉”,等待特異性識別的tRNA的進入(tRNA合成酶具有極高的特異性,能精準分辨出對應的tRNA)。最後,對應tRNA的結合觸發高效的氨酰化反應,將異亮氨酸迅速轉移到tRNA上,從而避免了異亮氨酸-AMP的水解。
[4] 如圖3所示,座標豎軸為適合度且向上為正方向,當一個有利突變在種羣中頻率逐漸提高時,種羣整體的適合度提高,表現在座標圖上為向一個適合度為極大值的山頂移動。但是極大值不一定是最大值,當種羣處於極大值(即局部最大值時),適合度想要進一步提高,就必須先降低,即跨越適合度的“深谷”。
圖3 適合度景觀示意圖丨圖源:DOI: 10.1126/science.adh3860
[5] 細胞經歷了減數分裂,每個細胞只有一套染色體,這個時候稱為是“單倍體”。
[6] 這裏的意思是,為了減少突變,這些基因開啓轉錄,並在過程中利用相關機制掃描並校正突變。所以在這個過程中,這些基因表達出產物並非“目的”,而只是副產物,其主要作用是掃描並校正突變。
[7] 細胞經濟理論大意是説,微生物細胞如同一個精明的經濟體,在核心資源(核糖體)有限的約束下,通過進化選擇出最優的資源分配策略:將蛋白質合成能力(核糖體)在製造代謝酶(用於轉化營養物質)和製造更多核糖體(用於擴大產能)之間進行權衡分配,其終極目標是最大化生長速度。該理論揭示了細胞生理的核心邏輯——生長速率根本上由資源投入的“經濟效率”決定,即如何在有限資源下獲得最高的“酶投資回報”,成功解釋了不同營養條件下蛋白質組分配的變化規律,併為預測細胞行為和優化代謝工程提供了強大框架。
本文基於知識共享許可協議(CC BY 4.0)譯自Yanai, I., Lercher, M. The two languages of science. Genome Biol 21, 147 (2020).
https://doi.org/10.1186/s13059-020-02057-5
注:本文封面圖片來自版權圖庫,轉載使用可能引發版權糾紛。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權説明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯繫後台。