ChatGPT核心研發者的跨界思維: 怎樣打破禁錮教育和創新的枷鎖_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!06-25 11:02
當夢想家都對陳舊的願景感到厭倦時,當不求回報的期望的灰燼沉澱在不可逾越的未來之上時,只有一種理性的光芒可以穿透黑暗:
為了實現我們的最至高無上的目標,我們首先必須心甘情願地拋棄它們。
本文經授權摘選自《為什麼偉大不能被計劃》(中譯出版社2023年5月),標題為編輯所擬。前往“返樸”,點擊“在看”並發表您的感想至留言區,截至7月2日我們會選出一條留言,贈書一本。
撰文 | 肯尼斯·斯坦利(Kenneth Stanley)、喬爾·雷曼(Joel Lehman)
翻譯 | 彭相珍
一
對目標的質疑,探索空間,踏腳石
想象一下,每天一覺醒來,不用去琢磨今天該乾點什麼,你有過這樣的體驗嗎?假設你去上班,你的老闆一反常態的沒有開例會,既不討論工作基準,也不説明工作節點,而是告訴你要做你最感興趣的事,你該如何自處?待稍後你上網瀏覽新聞,裏面既沒有提到關於學習成績的國家標準測試,也沒有提及未達成的經濟目標。説來也奇怪,當老師的還是該上課的上課,市場上該進行的交易也沒有受到影響。或許近期你不會碰上這麼漫無目的的一天,但萬一碰上了,這樣的日子該怎麼過?你或許會感到茫然困惑,或不知所措,或迷失方向。但有沒有可能,你反而會覺得日子更好了?
有意思的是,我們難得去談論“目標”在自身文化體系中的主導地位,儘管我們自出生起就受其影響。從蹣跚學步到第一天進幼兒園再到成年,我們跨入了一場評估的無限循環之中,且所有評估既有目的用於衡量特定目標,由社會或我們自己設定的進展。比如精通一門學科並找到一份對口的工作。實際上,“目標”從一開始就躲在幕後,從源頭開始,隨着時間的推移不斷積蓄力量,最終主宰我們的一切。
在某種程度上,我們不得不相信目標的意義,才能允許他主導我們生活的方方面面,但背後的原因也可能恰恰相反,即我們已經太習慣於通過目標來界定所有的努力,甚至忘了我們可以去質疑目標的價值。
在本書中我們將提出一系列的問題,質疑做事“有目標”的好處,但在此需要着重指出的是,我們主要針對的是所謂的高大上的目標,因為此類目標的實現是徹底的未知數。比如醫學研究人員尚未研發出治癒癌症的方法,計算機科學在短期內也很難説是否可以創造出足以媲美人類智力的人工智能。如果能發明一種不存在任何風險、環境友好且用之不盡的能源當然很好,但沒有人知道何時會實現。或者更天馬行空一些,發明時間旅行機器或瞬間移動怎麼樣?你甚至會給自己設定一些“大目標”,比如賺它10個億。……隨着“志向”變得越來越“高遠”,實現的希望便越發渺茫——這便是最耐人尋味的地方了。
那麼問題來了,如何才能實現“高大上”的目標呢?
把成功視為探索發現的過程會很有用。我們可以認為,畫出一幅傑作,本質上是在所有具備可能性的作品集合中將其發現,好比我們在一切可能性中,搜尋想要的那個“唯一”,即我們所謂的“目標”。
因此,我們可以把創造力看作一種搜索的手段,但這種類比並不全面,如果我們在尋找目標,那麼我們必定是在某些範圍內找出目標,這個範圍可以被稱作“搜索空間”,即所有具備可能性事物的集合。現在試着發揮一下想象力——就好像不同的可能性出現在一個大房間的不同位置,在這個巨大的房間裏,從一面牆到另一面牆從地面到天花板,每一個你能想到的圖像都在空中某個位置盤旋着,數萬億的圖像在黑暗中閃閃發光。
從“搜索空間”的角度思考,“發現”便是我們把創造的過程,看作搜索這個龐大房間的過程。從某種意義上説,自古以來人類文明的發展過程就是不斷探索這個房間的過程,我們探索的越多,就越清楚創造發明的可能性。你對這個房間探索得越多,就越能明白接下來該去往何處。通過這種方式,藝術家在創作時恰恰就是在存儲了所有具備可能性圖像的大空間中,尋找一些特殊或異常美麗的事物。他們在房間裏探索的越多,成功的可能性也就越大。
上述思維方式不僅適用於繪畫,我們同樣可以想象出一個裝滿任何其他東西的房間,舉個例子,它可以是裝滿了電腦的大房間。如果你在計算機領域鑽研了很長時間,那就會發現一件很有趣的事:你首先會開始理解這個房間的形狀,知道一台電腦是如何聯通另一台的,就像鋪着腳踏石的蜿蜒小路一樣。如果你在這條路上徘徊的時間足夠長,甚至能看到一些有趣的“可能性”開始在某些地方“探頭探腦”。
那我們為什麼要徘徊於此,何不直接前往頂尖計算機所在的位置呢?原因便是通往未來的唯一線索,只能在過去中尋獲。世界上第一台計算機ENIAC於1946年問世,每秒可運行5000條指令,而現如今一台普通的台式電腦,每秒能運行超過100億條指令。換言之,ENIAC的運行速率只有現今一台普通電腦速率的200萬分之一,真算得上是蝸牛爬了。
你可能會想,設計師們為何不在1946年就把目標定為製造一台高速計算機呢?當然現代人都知道這是可能實現的目標,但為什麼第一台計算機運行得這麼慢?這就是世界運作的方式,在這個滿是電腦的大房間被人踏足之前,沒有人知道那裏會存在何種可能性,你得在出發之前先參觀一番。簡而言之,在1946年,製造更高速計算機的踏腳石還不為人知,因為其尚未被發現,就像我們目前還不知道把如今的計算機速度再提升200萬倍的踏腳石在哪裏一樣。帶有踏腳石(stepping stone)性質的事物是通往更高層可能性的門户,我們必須先找到這塊石頭,踩穩後才能跨出發現的一步。
二
教學評估,成績,欺騙
對目標的日益迷戀會給社會造成怎樣的危害?是否有明確的案例表明,確立一個社會總體目標弊大於利?事實上,已有大量的科學證據表明這種情況經常發生。例如,下面的引言就呼應了社會科學中眾所周知的坎貝爾定律(Campbell’s law):任何量化的社會指標,越是被用於社會決策,社會腐敗的壓力便越大,也就越容易扭曲和腐蝕它所要監測的社會進程。
為了證明美國正在進步,你可以展示各種各樣的證據:學校的考試成績、犯罪統計率、逮捕報告,或其他可能讓政治家順利當選、讓普通職員獲得晉升的任何東西。在制定了此類統計標準之後,機構中的許多人就會絞盡腦汁地想辦法讓它看起來有進步,哪怕實際上根本沒有。
——大衞·西蒙(David Simon)
換句話説,類似學業成績測試這樣的社會指標,當其目標是“讓成績更上一層樓”時,效果往往是最差的。原因在於,單一的指標很難把握人們真正關注的是什麼。例如,以學生的考試成績為標準來評估教師,會直接迫使教師開展應試型教學,而最終的結果,不是培養出具備豐富知識和實用技能的學生,而是產出擅長記憶和考試的應試型學生。以考試成績為目標時,學生的成績可能會提高,但同時也意味着他們真正掌握的實用知識反而變少了。
任何“高大上”的社會追求,最終都會面臨同樣令人沮喪的悖論。當社會對進步的追求被打包為一種措施進行衡量時,就會產生目標驅動效應。如果目標十分“高大上”,那麼提升目標表現的驅動力很可能產生欺騙性,反而阻礙了人們發現最佳結果的能力。以國內生產總值(GDP)為例,這是衡量國家生產力的一項國際通用標準。每個國家都希望最大限度地提升GDP,因而“GDP最大化”就成了國家層面的一個目標。但GDP的增加,並不意味着保持當前的經濟政策一定能夠繼續提升GDP。因此,經濟發展可能會陷入一個“中國指銬”式陷阱——需要來一招“以退為進”才能夠獲得更大的增長。事實上,經濟學家們已經意識到,過度依賴GDP沒有意義,即使它是全球各國廣泛採用的經濟指標。這種悖論也被稱為“GDP崇拜主義”。
就像考試成績一樣,GDP這類指標越是“金玉其外”,反而越會變得“敗絮其中”。究其原因,GDP是如此單一的衡量標準,它並不能真正反映健康經濟體的真正內涵。一名善於玩弄權術的政客為了尋求連任可能會制定一些政策來在短期內大幅提高GDP,但從長遠來看,這些政策對經濟是有害無利的。這類問題恰恰説明了通過單一指標來制定國家政策的危險性——它們很容易導致欺騙。
但是,在談論教育這樣重要的社會支柱時,要求人們承認目標導向型思維的不足之處可能十分困難。但如果提升與特定目標相關的表現不是取得成功的正確途徑,那麼我們要怎麼做才能夠確保“自己對自己負責”呢?我們希望這些簡單的、基於目標進展的衡量標準能夠告訴我們,一位教師或一所學校是否做得很好,這樣我們就可以獎勵那些成績提高者,懲罰那些成績下滑者。但不幸的是,問題越複雜,目標導向的思維就會越乏力,而教育無疑是一個非常複雜的社會問題。
儘管這聽起來有違常理,但一個班級的學生在某次考試中的分數高於去年,可能並不會比他們的分數低於去年更好——尤其是在考慮到學校未來的光明前景時。這是因為通向真正的、近乎完美的全班表現的踏腳石,很可能與任何常見的教育衡量指標毫無關聯。各種測試驅使每個學生取得更好的成績,這些成績代表了人們期望的理想結果(即目標)。但我們已經看到,這幾乎是一條註定行不通的死衚衕。換句話説,試圖通過衡量成績來實現任何遠大的教育目標,都是自欺欺人。這也就是説整個偉大教育事業的追求過程,完全基於對目標的盲目崇拜。這就是為什麼我們需要意識到,在由目標驅動的成功中,隱藏着欺騙性的暗流。這種欺騙性甚至會影響到整個社會層面的努力,並且人們可能在很長一段時間內都意識不到它造成的傷害。
比如,在軟件工程領域(開發新軟件的行業)發展的早期階段,也曾出現過類似“一切皆可測量”的風潮。許多人尤為關注具體測量標準帶來的前景,期望以此提高生產力和軟件質量。湯姆·狄馬克(Tom DeMarco)在1982年寫了一本頗具影響力的書,描述了這一風潮的特點,其中最有名的一句話是“無法測量的東西,就是不可控的東西”。35年後,狄馬克又發表了一篇文章,表示自己的觀點已經隨着時間的推移發生了轉變。“那本書想要表達的言外之意其實是,‘衡量標準是好的,更多就更好,越多就越好’;但最終事實證明,‘它們的使用,反而應該謹慎而節制’。”因為,對由數百萬行代碼和無數相互作用的部分組成的更復雜的軟件而言,“一刀切”的簡單衡量標準將變得毫無價值。在同一篇文章中,狄馬克寫道:“儘管衡量標準使我們能夠對進程施加控制,但嚴格的控制只適用於那些沒有潛力產生重大影響的項目。”換句話説,只有在目標相對平凡的情況下,衡量標準才是有用的。如果我們將其應用到宏偉事業上,就會使其失去其價值。在軟件開發領域,對衡量標準的盲目推崇,導致工程師們被迫不斷抬高衡量標準,哪怕他們知道這些衡量標準已經日益與現實脱節——這種盲目追逐目標的主導性風潮,在持續多年之後才開始消退。目前,美國的教育系統可能正在上演同樣的、盲目推崇“一刀切”目標衡量標準的錯誤。但這一次,受到自欺欺人式成就衡量標準束縛的對象,從軟件工程師變成了兒童和教師。
三
“一刀切”,統一標準,多樣性探索
除了對精準測量的錯誤信任外,基於目標導向型思維給教育領域帶來的另一個長期傷害,是對“一刀切”的統一標準的追求。其背後的邏輯是,無論身處何處,每個學生都應該有機會獲得相同類型和同等質量的教育。其背後的驅動邏輯是確保教育的公平性,即生活在美國東北地區的學生,應該接受與生活在西部或南部的學生同等的教育。換句話説,各地的學校應該在教給學生什麼樣的知識上,遵循統一的標準。這樣一來,無論住在哪裏,所有的學生都能學到相同的知識,並且能在高中畢業後,為進入職場或下一階段的高等教育做好同等的準備。
全國各地的學校以不同的方式執行同一個教育理念,可以定期對學生的表現進行統一評估。這樣一來,我們就有了適用於不同地區的國家統一標準,以及許多具體的衡量標準,用以反映學生個人和他們的教師在其學業或職業生涯中的具體進展。因此,如果某個地區的學生接受的教育質量較差,或者某所學校的教師表現不佳,人們就很容易發現問題。這一舉措背後的邏輯是,全國統一的評估,可以幫助確保教育平等,更清晰的橫向比較也可以提高評估的嚴格程度。
推動全國教育統一標準的一個例子,就是美國“共同核心州立標準”(CCSS)。該標準由全美州長協會(包括其他機構)發起,與華盛頓成就公司(Achieve, Inc)合作制定。CCSS的主要目標,是建立一套統一的國家教學標準,以及一套與之匹配的定期和統一的評估體系。儘管仍存在爭議,但美國絕大多數州已經採用了CCSS,問責制、標準量化和統一性等方面均得以進一步強化。雖然這種統一性表面看起來可能是有益的,但隱藏在光鮮表象之下的,就是我們熟悉的目標神話的謬誤。
事實上,CCSS的一個明確功能是設定各種教育目標,正如CCSS網站上的常見問題板塊表明的那樣,“通過為學生的學習提供明確的目標,教育標準旨在幫助教師們確保學生擁有通向成功所需的技能和知識。”當然,如果我們不能時常準確地衡量各項目標的進展來使之保持統一,以便於進行普遍性的橫向比較,那目標又有什麼用呢?出於這個原因,CCSS也幫助“開發和實施共同的綜合評估系統,用於每年衡量學生的表現,以取代各州現有的、不統一的測試系統”。
儘管我們可以輕易地理解推動統一教育標準背後的良好意圖,但在這一點上,我們也能看到,目標的誤導性是如何破壞這件“美事”的。統一標準很像前文提及的準確性問題,它是評估和測量的一個好幫手,但卻是教育領域“尋寶者”的勁敵。
一個徹底統一的教育系統,能從細枝末節之處確保每個學生擁有平等的經歷,但其意義不大。學生們的課程、學業目標和測試都是一模一樣的,這種“一刀切”的統一性,儘管可能通過增強的目標感和科學性給人帶來安全感,但與提升孩子們的教育質量沒有必然的聯繫。無論選擇什麼樣的統一標準,都有可能帶來好的或壞的結果。當然,制定一套劣質的統一標準,必然會讓情況變得更糟。
強加的教育統一性可能會造成更多不易察覺的“內傷”,因為除了沒有任何內在的益處之外,統一性還會損害孩子們在未來探索和發現的能力。執行統一的標準意味着向一個單一的標準聚合,同時也消滅了個別學校或個別州目前可能正在探索的其他標準的多樣性。因此,未來的標準和測試,可能只是對強制實施的現有標準的調整,因為這是教師們在課堂上可以應用和探索的唯一標準。
教育問題如此複雜,以至於人們幾十年來都沒有找到一種“一勞永逸”的解決方案。為此,我們必然要思考一個問題——非目標思維對教育意味着什麼?到目前為止,本章就教育領域的論述,遵循的是一種熟悉的模式,即目標導向的方法成為目標欺騙性的犧牲品,使關於“如何取得進步”的傳統設想變得岌岌可危。但我們同樣熟悉的是,如果我們能夠設法擺脱只考慮目標的做法,教育事業就能再次獲得一線生機。有時也許應該允許廣大教師和學校系統遵循其本能和直覺,哪怕他們在評估中的得分連年下跌。但是,隨着“應試教育”的流行和“力爭高分”等目標壓力的增加,對這種“直覺”的依賴顯然受到了壓制,其結果是教師們大部分的自主權、直覺和創造力被剝奪,教師們對教學的熱情和初心也被慢慢耗盡。
或許,我們最好將投入評估方面的精力轉移至嘗試不同的想法,而不要過分強調衡量標準的精確度。這將使教師們能夠充分利用其多年來在與學生的互動中磨鍊和積累的創造力和近乎直覺化的專業知識,讓他們去自由地探索更有潛力的路徑。就像在圖片孵化器網站上一樣,多樣性探索產生的一些想法可能註定要失敗,但另一些則可能帶來有價值的發現,而整個體系(就教育而言,是整個社會)將會同時從不同的路徑和嘗試中受益。那些看起來有趣或有前途的方法,會成為通向成功的踏腳石,其他人可以在此基礎上繼續探索和發現。通過這個方法,整個社會就能成為教學方法的“尋寶者”。但是這種對不同可能性的有益探索,可能會受到當前僵化的、以目標為導向的主流文化的排斥,至少在美國會這樣。(以芬蘭的小學教育系統為例,它為芬蘭的教師們提供了更大的個人自主權,並且不會要求學生參與標準化的測試。在這個意義上,芬蘭的教育系統,更多遵循了非目標的探索精神。所以,芬蘭在教育方面也處於世界領先地位,遠遠超過了美國。)
四
經費申請中的分歧與共識,砸錢與出成果
要了解目標對科學進步可能產生的影響,就得了解科學在實踐中是如何運作的。科學進步最基本的驅動力,來自科學家們的實驗,但這樣的實驗往往成本很高。因此,資金往往成為限制科學發展的因素——尤其是考慮到知識的進步並不總是能夠在短期內帶來回報這個事實,這就意味着,尋求新探索和新發現的科學家們,首先要為實驗的項目籌募資金。
科研項目申請經費的大致流程是:科學家們向資助機構提交申請,並提供闡釋了科研想法的提案;提案隨即被送到一個由專家同行評審員組成的評審小組,這些評審員通常是提案所涉領域,如生物學或計算機科學領域的資深科學家;評審專家隨後給出評級,包括從差到優的不同等級。一般來説,獲得最高平均評級的提案,最有可能獲得資助。
乍看之下,這是一個十分合理的篩選過程。理想情況下,某個領域中最優秀的想法,就應該能夠説服一個由專業科學家組成的小組,並將其評定為優秀。然而,這種表面合理的常識背後,同樣隱藏着麻煩,因為這個評審體系的主要作用是支持共識。換句話説,評審員羣體越是認同提案的優秀性,機構提供資助的概率就越大。然而問題在於,共識往往是通往成功的踏腳石的最大障礙。
尋求共識將阻止人們沿着有趣的踏腳石前進,因為不同的人對什麼是最有趣的踏腳石的看法或許並不一致。解決不同人羣在喜好上的分歧,往往會導致相互對立的踏腳石之間彼此妥協,就好像將對比鮮明的黑白兩色混合到一起,最終只會產生了寡淡的灰色。這種妥協的產物,最終往往只會沖淡兩個原始理念的色彩。對於撰寫提案的科學家來説,贏得資助的最佳方式是提出完美的妥協方案,即最柔和的灰色——足以滿足所有人的眼光,但不太可能帶來高度的新奇性或趣味性。因此,當人們嘗試在探索中尋求共識時,其結果只能是“清湯寡水,無甚滋味”。整個系統不是讓每個人去發現自己的踏腳石鏈,而是將各種不同的意見壓縮成一個四平八穩的平均值。
也許有時候支持最大限度的分歧,而不是一致的意見,會更有意義。如果你跟風去做熱門的研究,並且鸚鵡學舌似的隨大流,或許能夠得到廣泛的認可和支持;相反,一個真正有趣的想法,或許會引發爭議。在我們目前已知和未知的邊界,仍存在一些尚不確定答案的問題,這就是為什麼在科學的未知領域,專家們的意見應該保持分歧和發散狀態,正是在這片位於已知和未知之間的“蠻荒”邊界地帶,我們應該讓人類最偉大的頭腦進行探索,而不是在最大共識的舒適區“沉迷享樂”。試想一下,哪個項目可能更具有革命性:是評分“喜憂參半”的項目,還是“全體好評”的項目?意見分歧的專家們,或許比總是達成一致意見的專家們更有推動偉大成就的能力。
除了推動人們達成共識之外,基於目標的思維還可能從其他方面影響科研投資的決策。例如,假設你是目標論的信徒,可能會認為科學進步的框架是可預測的。換句話説,根據“有志者,事竟成”的目標性思維,通往重大發現的踏腳石,將以一種有序、可預測的方式排列。在這種思維導向下,治癒癌症的關鍵創新,似乎應該是對已經存在的癌症治療方法的改進或完善,或至少應該來自與癌症直接相關的研究領域。然而,在本書中,我們一次又一次地看到,通向卓越成果的踏腳石是不可預測的。因此,如果我們想要治癒癌症,只專注於癌症領域可能無法使我們實現這個宏偉目標。但是,即使一項研究未能實現其原始目標,其副產品也可能會在看似不相關的領域實現意外的突破性發現。
事實上,各國政府已經投入鉅額研究資金,開展了眾多諸如此類的重點研究項目,以期解決某些特定的科學問題。例如,日本通商產業省在1982年啓動了一個長達10年的大規模研究項目,即“第五代計算機系統項目”,旨在推動日本的計算機技術躋身世界領先地位。雖然日本政府投入了大量資金用於定向研發,但人們普遍認為這個項目沒有實現其目標——開發出具備商業成功潛力的產品,儘管這個項目的確為日本培養了新一代有潛力的日本計算機研究人員。同樣,美國總統尼克松於1971年發起的“抗癌戰爭”(旨在消滅癌症這一高死亡率的疾病)也尚未取得成功,儘管這個項目在研發更有效的癌症治療方法方面進行了針對性研究,並加深了人們對腫瘤生物學的理解。事實上,類似人類基因組計劃等看似不相關的科學研究項目,更有希望發現更好的癌症治療方法。
當然,有時雄心勃勃的科學探索計劃也能獲得成功,比如20世紀60年代的美蘇登月競賽就是由肯尼迪總統發起的,他在國會演講中承諾,“我相信這個國家能夠齊聚一心,全力以赴達成這個目標,十年之後,人類將乘坐宇宙飛船登陸月球並且安全返回。”但這份充滿不確定性的宣言後來之所以能夠實現,是因為它當時正好處於技術可能性的邊緣(也就是説,這個宏偉的目標彼時離實現只有一步之遙)。於航天飛機之前出現,並促使航天飛機的問世成為可能的一連串發明,並不是太空計劃本身的目標,但航天飛機的發明必須依賴於它們的出現。假如登月目標在19世紀60年代提出,則必然會以失敗告終。
然而,從這些成功案例中得出的關於目標力量的潛在誤導性結論,往往助長了天真的目標樂觀主義——認為只要有足夠的資源支持,任何目標都可以在歷史上任何時期堅定地成立並一定能夠實現。例如,美國癌症協會的一位前任主席曾經説過:“我們離治癒癌症的目標已經非常近了,只是缺少將人送上月球的那種意願、資金和全面規劃。”最後,即使在這些宏偉的科學事業的成功案例中,最終給人類社會帶來最深遠影響的技術,往往是未曾預料到的。例如,太空競賽給我們帶來了人工耳蝸、記憶海綿牀墊、凍幹食品和改進後的急救毯等創新產品。
五
應該投資給誰?
一個類似的思路是,科學項目如何影響世界同樣存在着可預測的框架。也就是説,我們也許能持續地靠投資來不斷優化那些目前看起來最有可能產生影響的科研項目,最終會催生出一些具備突破性影響的科研項目。背後的邏輯是,具有適度影響力的科研項目將帶來更多更具影響力的科研項目,最終使科學的探索和發現給世界帶來顛覆性變革。
事實上,類似美國國家科學基金會等資助機構評估科研經費申請的一個主要標準是擬議研究項目的影響力範圍。因此,被認為影響潛力較小的科研項目,獲得資金的可能性也低。而政客們傾向於嘲笑那些目標看似異想天開的科研項目,即顯然不會帶來任何重要成果的研究,認為它們純粹就是浪費錢,這種態度的背後也體現了同樣的邏輯。例如,美國參議員湯姆·科伯恩(Tom Coburn)在2010年的一份報告中,將一項實驗稱為“一羣對科學上癮的猴子”,他在2011年的另一份報告中,則將另一項實驗諷刺為“跑步機上的蝦”。美國參議員威廉·普羅克斯邁(William Proxmire)在1975—1988年期間,每月給科研項目頒發的“金羊毛”獎,也秉持了類似的邏輯,用於嘲弄在他看來顯然浪費了政府經費的科研項目,獲獎者包括一些有着譁眾取寵主題的科學研究,如“螺旋蠅的性行為”“素食主義的行為決定因素”“駕駛員對大型卡車的態度”,等等。
這些例子背後,存在一個非常具有誘惑性的推理過程,即在研究項目開展之前,我們有可能根據研究項目及其成果是否具備廣泛的社會影響,而將其劃分為重要或不重要的項目。讀到此處,諸位或許已經能夠看出,這種想法過於武斷——因為許多重要的發現,都是偶然獲得或意料之外的。
問題的關鍵在於,用更適合評判整個系統的標準來評判單一的踏腳石,可能是短視的做法。歸根結底,科學作為一個整體,其目標是發現具備深刻性和變革性的真理。但在這個過程中,任何特定的科研項目是否具有變革性,可能根本不重要。事實上,一個科研項目很有趣,並能夠進一步生成更有趣或更意外的實驗結果,或許比其自身具備重要性更值得關注。
在科學領域,決定是否支持重大項目,或根據預估的影響力判斷項目是否值得投資的另一個思路,是將科學研究項目符合特定利益的程度作為投資的評判標準。在不涉及太多政治因素的情況下,這就意味着政府只希望資助它當時認為重要的研究議程,或能夠為國家提供明確的短期利益的研究項目。
例如,根據美國眾議員拉馬爾·史密斯(Lamar Smith)在2013年提出的《高質量研究法案》(High Quality Research Act)中稱,在決定資助任何科研項目之前,美國國家科學基金會的主席必須發表一份聲明,證明該項目“(1)符合美國的國家根本利益,通過促進科學進步,推動國家健康、繁榮或福利,並確保國防安全;(2)具備最高的質量,具有突破性,能夠回答或解決對整個社會而言最重要的問題;(3)與基金會或其他聯邦科學機構正在資助的其他研究項目不重複”。第二點規定背後的設想是,根據科研項目的重要性來判斷其是否值得資助,是可能的或可取的,而第一點規定設想的是,科學研究只能沿着對國家有直接利益的方向狹義地展開,而不進行更廣泛的搜索。
當然,“只要大量地投入資金,就能可靠地產出特定重要研究領域的根本性突破”的想法非常具有吸引力,但狹隘地框定重點研究領域和宏大目標驅動的科研項目其實並不可取。因為,不管其基本設想是否足夠吸引人,科學探索的結構其實並不是這樣運作的。誰能確定下一個偉大的、可商業化的技術會從哪裏來?所以癥結是,無目標性的探索貌似讓前景聽起來很悲觀,但它能使科學的世界變得更有趣。還有許多有趣又重要的發現等待我們去探索,但發掘它們需要持續不斷的智慧投入和開放的心態,而不是簡單的目標式蠻力。
你可能會一如既往地提出疑問:我們怎能如此自鳴得意而一味地推崇踏腳石的作用,卻不知道它們通向何方?這種想法不過是目標思維的負隅頑抗。正如前文所述,我們有充分的理由相信“但行前路,無問西東”,此舉實際上能夠引導我們通往一個更加光明的未來。因此,“不知去往何處”恰恰是信息收集器的運行方式、尋寶者的探寶方式、收集踏腳石的方式、通往任何地方的正確道路,是通往未來的途徑。“不知前路通往何方”,才是人類能創造偉大事物的原因。共識、可預測的重要性、與國家利益的一致性——這些都是目標思維的衍生物,只會導致我們在朝未知世界邁進的過程中,離我們想要的越來越遠。
作者簡介
[美]肯尼斯·斯坦利(Kenneth Stanley),全球創新思維和前沿科技領域的代表性專家、人工智能科學家,OpenAI研究員。曾任中佛羅里達大學教授,深耕機器學習領域,發表了80多篇專業論文,其中數10篇獲得了最佳論文獎,並經常受邀在世界各地發表演講。他還曾是Uber人工智能實驗室的創始成員,在行業內具有卓著的影響力。
[美]喬爾·雷曼(Joel Lehman),全球知名人工智能科學家,OpenAI研究員。他也曾是Uber人工智能實驗室的創始成員,目前在OpenAI做“大型語言模型(大模型)+演進算法”方面的研究,聚焦的領域包括人工智能安全、強化學習和開放式搜索算法。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。