“照片51”:DNA雙螺旋的阿凡達_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!02-28 10:29
2023年是DNA雙螺旋結構發現七十週年。1953年2月28日,沃森和克里克根據女科學家弗蘭克林拍攝的X射線衍射照片,成功推斷出遺傳物質DNA的三維結構模型。雙鏈鹼基配對模式的簡約之美,直觀提示了遺傳物質的複製機理,瞬間開啓了通往分子生物學的快速通道。
撰文 | 徐亦迅
如果我們用一個問卷來調查1901年以來所有諾貝爾生理學或醫學獎項的知名度,排名第一的很可能就是1953年DNA雙螺旋結構的發現。雙鏈鹼基配對背後呼之欲出的遺傳物質複製機理,使該發現被譽為生命科學史上繼達爾文演化論和孟德爾遺傳學之後的第三座里程碑。
發現人之一沃森 (James Watson) 出版於1968年的The Double Helix(《雙螺旋》)一書,寫作手法引人入勝,非常適合中學生以及還未確定專業的本科生用來測試自己對基礎生物學是否有興趣。但是很多對生物化學有熱情的青年學生在讀完此書後可能會有不過癮的感覺,尤其是無法在科普意義上理解沃森和克里克 (Francis Crick) 如何從X射線衍射照片推斷出DNA的二級結構。令人遺憾的是,沃森此書的視角過於主觀,對女科學家弗蘭克林 (Rosalind Franklin) 的重要貢獻未能給出全面公正的評價。
1970年代以來,圍繞着DNA雙螺旋這一經久不衰的話題,也湧現了不少出色的科學史專著與文章。但我們很難發現一篇獨立的科普著述,能從弗蘭克林著名的“照片51”出發,把從X射線衍射數據推斷DNA結構的要點都講清楚。本文試圖將很多零散的文獻材料整合起來,對這個知名度極高的科學史案例給出不失新意的詮釋。
首先簡要回顧一下1953年3月前與DNA研究有關的幾個重要事件:
· 1944年:埃弗裏 (Oswald Avery) 等人給出了紮實的實驗證據,表明DNA是肺炎鏈球菌的“轉化因素”,大體確立了遺傳物質的本質是DNA;
· 1951年11月:剛到劍橋大學卡文迪許實驗室不久的博士後沃森,對導師肯德魯 (John Kendrew) 的蛋白結構研究毫無興趣。他深知在倫敦的國王學院 (King’s College) 才是用X射線衍射研究DNA結構的“前沿陣地”,於是經常主動前來打探最新的進展。弗蘭克林在一個報告裏討論了她在DNA纖維樣品研究中發現的兩種構型:A型 (她最早稱之為“類晶體型”,環境相對濕度小於75%) 和 B型 (她最早稱之為“高濕型”,環境相對濕度大於90%);
· 1952年:查戈夫 (Erwin Chargaff) 在回看自己積累的數據時發現,DNA所含的四種鹼基中,腺嘌呤 (Adenine, A) 與胸腺嘧啶 (Thymine, T) 數量幾乎一樣,鳥嘌呤 (Guanine, G) 與胞嘧啶 (Cytosine, C) 的數量也比較接近;
· 1953年1月:沃森和克里克曾在1952年提出過一個錯誤的DNA三螺旋模型,卡文迪許實驗室主任小布拉格爵士 (Lawrence Bragg) 明令禁止他們與弗蘭克林和威爾金斯 (Maurice Wilkins) 競爭,必須放棄DNA結構建模的嘗試。沃森在大半年過去後,藉着美國加州理工大學的鮑林教授 (Linus Pauling) 將要發表DNA三鏈模型的最新消息再次來到國王學院。雖然沃森與弗蘭克林的談話進行得很不愉快,但他在威爾金斯那裏卻獲得了意外收穫,看到了弗蘭克林在1952年5月拍攝的B型DNA“照片51”:
· 1953年2月:沃森回到劍橋後轉述給克里克的“照片51”樣貌雖然很有信息量,但他並不知道照片背後的一些重要參數。克里克利用私交邀請威爾金斯前來共進午餐,同時表明他和沃森已獲得小布拉格主任的准許而將重新開始DNA結構的建模。威爾金斯不願向克里克直接提供“照片51”的具體參數,但他提到弗蘭克林在1952年12月曾向英國醫學研究委員會 (Medical Research Council, MRC) 提交過一篇書面進展報告,而克里克的博士論文導師佩魯茲 (Max Perutz) 正好是MRC委員會的成員。
在揭秘“照片51”背後隱藏的DNA分子結構信息之前,我們需要掌握一些X射線衍射的基礎知識。很多生物大分子較難形成具有良好衍射性質的晶體,而DNA要等到1969年才首次結晶成功。幸運的是,不少線性多聚體分子在細胞外的分離純化過程中容易形成纖維。當實驗者用垂直於纖維軸方向的X射線照射這些樣品時,得到的衍射圖案中藴涵着分子水平上的尺度信息 (圖1)。
圖1. 纖維X射線衍射圖案中藴涵大分子的三維結構信息。[Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.]
能夠形成纖維的生物大分子一般是組分和單體結構已知的多聚體,比如DNA就是由四種脱氧核苷酸通過3’,5’-磷酸二酯鍵首尾相連的序列。每一條DNA單鏈都有方向性,一端被稱為5’末端,另一端則被稱為3’末端 (圖2)。研究者若能把來自DNA纖維X射線衍射分析的尺度數據與已知的單體結構信息相結合,通過立體化學的限制條件來建立結構模型,往往事半功倍。
圖2. DNA是一種具有方向性的多聚體大分子。[Voet, D. & Voet, J.G. (2011) Biochemistry, 4th edition, John Wiley & Sons Inc.]
無論是類晶型 (crystalline,比如A型DNA) 還是非晶型 (non-crystalline,比如B型DNA) 的纖維,其X射線衍射圖案往往都有沿着纖維軸方向分佈的間距相等的層線 (layer lines, 參見圖1中的衍射圖案),而層線的間距又與大分子結構的週期性有關。
圖3. 傅里葉變換是分析X射線衍射數據的重要數學工具。[Freeman, D. (2011) MIT Course 6.003, “Signals and Systems”, Lecture 20.]
有週期性的晶體或者纖維結構,可以用週期尺度為D的格柵模型 (gratings) 來描述。單束X射線穿過格柵後會被分解為多束電磁波,它們抵達檢測屏幕時由於路程差而產生了相位差,從而通過干涉效應在膠片上留下衍射強度分佈圖樣。多束射線相互干涉後的振幅分佈函數F(θ),一般取值為複數,可以通過並不複雜的數學推導後用一個積分來計算 (圖3)。公式中的f(x) 函數代表纖維中分子結構的電子密度分佈,x為格柵模型的任意一點與纖維軸原點的距離,λ是入射X射線的波長,θ為每束射線改變方向後與入射方向的夾角,而虛數單位i (-1的平方根) 在電子工程文獻中常用j來表示。在散射角θ一般比較小的情況下,我們可以用sin(θ) ≈ θ的近似,這樣上面這個積分公式就成了著名的傅里葉變換 (Fourier transform) 。
纖維物質中一個相當常見的結構元素就是螺旋,而克里克本人在博士論文研究過程中,曾在1952年與兩位X射線衍射專家合作,發表了螺旋結構傅里葉變換的CCV理論 (Cochran, Crick & Vand)。
圖4. 螺旋結構的傅里葉變換。[Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.]
CCV理論曾被應用於已知為螺旋結構的多肽鏈X射線衍射分析,與實驗數據的一致性相當好。螺旋結構經過傅里葉變換後展示的衍射圖案中,有一個非常顯眼的“X” (圖4, Saint Andrew Cross)。描述一個單鏈螺旋最重要的兩個參數是:螺距P (pitch),半徑 r (radius)。當一個螺旋半徑不變而螺距變大時,其傅里葉變換預測的“X”圖案中層線間距會變小 (圖4,a和b);當一個螺旋的螺距不變而半徑變大時,其“X”的兩臂與子午線的夾角δ會變小 (圖4,a和c)。需要特別注意的是,圖4b顯示的“X” 夾角δ貌似變大了,這其實是層線間距變小後產生的錯覺。如果我們把δ的大小定義為寬度w與層線數l (圖4中的例子:l = 10) 比值的反正切函數,就會發現圖4a和圖4b中的兩個“X”在層線數相同時寬度w是一樣的。
圖5. “照片51”中的四大顯著特徵:間距相等的層線、存在“X”圖案、菱形模式、第四級層線消失
沃森雖然對CCV理論一知半解,但通過與克里克一年多的交流,第一眼看到“照片51”中的“X”也能立刻知道DNA結構中含有螺旋鏈。克里克結合沃森轉述的“照片51”概貌與弗蘭克林MRC報告中的重要信息,總結出對搭建DNA分子模型非常重要的四大特徵 (圖5):
· “X”圖案提示了螺旋鏈的存在,但還不能確定有幾條鏈。通過弗蘭克林報告中給出的夾角δ,克里克可以推算出B型DNA的螺旋半徑約為1納米 (螺旋半徑r與傅里葉變換後圖案中的δ正切函數值成反比);
· “照片51”中央有個白色圓點,這是由於原點附近的“赤道層線” (l = 0,也可稱為第零級層線) 與第一級層線 (l = 1) 衍射強度過大,為避免整張底片的過度曝光,實驗時一般用圓柱形鉛塊來遮擋。通過度量從第二級層線開始的平均間距,很容易推算出B型DNA的螺距約為3.4納米;
· “X”中央的上下左右共有四個菱形區域 (圖6),其中上下兩個菱形中沒有任何衍射強度。克里克據此可以推斷:DNA分子的核糖-磷酸骨架在外,而鹼基在內。這兩個菱形在子午線方向的對角線跨度為10個層線,提示B型DNA每圈螺旋中有10個核苷酸單體 (也就是10個磷原子);
· 第四級層線的消失:克里克根據他自己的CCV理論做了一番數學推導後發現,兩條共軸而相互纏繞的螺旋鏈,投影到二維平面上就是兩個有相位差的正弦波(或餘弦波),若它們的相位差是螺距的3/8,那麼在傅里葉變換後疊加就會產生第四級層線的相消 (圖6)!這也是從1953年2月開始,沃森和克里克把精力集中在雙鏈螺旋模型搭建上的主要依據。
圖6. “照片51”中的菱形圖案與第四級層線的消失。
雖然有了共軸而相互纏繞的雙鏈、鹼基在內、以及螺距和半徑等重要信息和參數,但沃森在搭建結構模型過程中還是遭遇了各種困難。他先是假設了所謂的“同類配對原理”,嘗試把兩條鏈上的鹼基按照A:A,C:C,G:G, 和T:T來對應排列 (圖7)。腺嘌呤(A)和鳥嘌呤(G)是雙雜環結構,而胞嘧啶(C)和胸腺嘧啶(T)是單雜環結構,因此沃森的嘌呤對在尺度上明顯要大於嘧啶對,放到螺旋內部根本不可能嵌入一個規則的圓柱。另外“同類配對原理”也無法解釋前文提及的查戈夫鹼基比例經驗規則。
圖7. 沃森根據“同類配對原理”構建的雙鏈DNA結構模型示意圖。[Watson, J.D. (1968) The Double Helix, Atheneum Press]
當時與沃森和克里克共用一個辦公室的多諾休 (Jerry Donohue) 看到這個模型後也指出,沃森依據戴維森的教科書選用的鳥嘌呤(G)和胸腺嘧啶(T)互變異構體是烯醇式,而多諾休認為在活細胞的生理環境中應該是酮式 (圖8)。在多條證據推翻“同類配對原理”後,沃森才開始擺弄根據酮式互變異構體重新制作的鹼基紙板模型,試圖尋找新的雙鏈間鹼基配對模式。根據沃森在The Double Helix一書中的回憶 (克里克的版本與之有明顯的出入),紙板模型讓他頓悟了A:T對與C:G對在總體外形輪廓上相似,而其它的兩兩組合方案都無法做到這一點。使用G和T的酮式互變異構體後,A:T對與C:G對之間都至少可以形成兩個氫鍵 (圖8),而這一配對模式又能符合查戈夫經驗規則,讓克里克有一種好到難以置信的感覺。
圖8. 鳥嘌呤(Guanine)和胸腺嘧啶(Thymine)的互變異構對發現鹼基配對的重要性。[Crick, F.H.C. & Watson, J.D. (1954) Proc. Royal Soc. A 223: 80-96]
在沃森領悟到鹼基配對的同時,克里克還從弗蘭克林書面報告中發現了一個只有他能領會的要點: A型DNA纖維由於接近晶體,弗蘭克林指出其晶胞 (unit cell) 屬於面心單斜類型 (face-centered monoclinic),幷包含C2空間羣的對稱元素 (圖9)。克里克在與導師佩魯茲一起研究載氧血紅蛋白的晶體結構時,就曾與C2空間羣打過交道,非常瞭解其數學和物理意義。他深知B型DNA纖維只是水含量增加,其內藴的對稱性應該與A型DNA一致。C2空間羣的存在意味着雙鏈DNA的二重對稱軸 (dyad axis of symmetry) 必須在圖9垂直於紙面的方向,要求沿着纖維軸的雙鏈互為反平行 (anti-parallel)。如果按照沃森最初構想的平行 (parallel) 雙鏈 (圖7),那麼對稱軸將平行於纖維軸,這與C2空間羣的存在是不可調和的矛盾。
圖9. 克里克根據面心單斜C2空間羣推斷出DNA雙鏈反平行。[Lydon, J.E. (2003) Liquid Crystals Today 12: 1-9; Lucas, A.A. (2008) J. Chem. Educ. 85: 737-743]
克里克及時領悟到雙鏈必須反平行,也解決了沃森在搭建模型中的一個立體化學困難。從“照片51”的分析中得到單股螺旋的螺距為3.4納米,相互纏繞的雙鏈如果是平行的,那麼表觀螺距 (apparent pitch) 就應該是6.8納米,相鄰鹼基間的轉角則為18度。只有18度的轉角使得模型的原子間距過於擁擠,整個結構顯得過緊而不合理 (圖10)。而一旦採用了反平行模式,整個雙鏈的表觀螺距就還是3.4納米,相鄰鹼基間的轉角成了36度,構建雙鏈模型的最後一個困難就迎刃而解。
圖10. 弗蘭克林MRC報告中的參數與雙鏈反平行對DNA結構建模的重要性。
DNA雙螺旋結構的發現過程彰顯了跨學科合作的重要性。弗蘭克林除了獲得“照片51”這一至關重要的實驗數據,她本人的理論分析離正確的雙螺旋模型 (圖11) 也只有兩步之遙。克魯格教授 (Aaron Klug) 在仔細閲讀了弗蘭克林當年留下的研究筆記本後發現:
· 她瞭解查戈夫的經驗定則,寫下了兩個嘌呤鹼基 (A和G) 以及兩個嘧啶鹼基 (C和T) 之間可以互換的正確想法,已經接近鹼基配對的概念;
· 她畫出了DNA的平行雙鏈螺旋示意圖,只是沒有意識到C2空間羣的重要性,尚未領悟到雙鏈走向必須反平行。
克里克認為弗蘭克林若沒被他和沃森搶先,也能在幾個月後解出DNA的雙螺旋結構,只是這一過程會是循序漸進的,而不是如雷電般的靈光乍現 (… but the results would have come out gradually, not as a thunderbolt, in a short paper in Nature.)。
圖11. 沃森和克里克搭建的DNA雙螺旋模型。[Watson, J.D. & Crick, F.H.C. (1953) Nature 171: 737-738; Watson, J.D. (1968) The Double Helix, Atheneum Press.]
1958年,弗蘭克林不幸罹患癌症而在37歲時英年早逝,令人扼腕嘆息。如果她能得享天年,那麼1962年的諾貝爾生理學獎極有可能是她與沃森和克里克分享。歷史也註定不會忘記這位女科學家的卓越貢獻,英國王家學會 (Royal Society) 在2003年設立了“弗蘭克林獎章” (Rosalind Franklin Award),每年表彰一位在科技/工程/數學 (STEM) 領域有傑出貢獻的女科學家。
Rosalind Franklin (1920-1958)
推薦閲讀
1 Olby, R. (1974) The Path to the Double Helix, University of Washington Press.
2 Olby, R. (2009) Francis Crick: Hunter of Life’s Secrets, Cold Spring Harbor Laboratory Press.
3 Markel, H. (2021) The Secret of Life: Rosalind Franklin, James Watson, Francis Crick, and the Discovery of DNA’s Double Helix, W. W. Norton & Company.
本文原載於微信公眾號“藥時代”,《返樸》此次發表時作者修訂了部分文字和圖片。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。