張江:尋找人工智能時代的牛頓
認識規模法則
假設某天你走進比薩店,點了一個直徑為9英寸的比薩並付了錢。經過幾分鐘的等待,店員突然走過來跟你説:“抱歉,我們的9英寸比薩已經賣完了,我給您換成兩個5英寸的吧?”那麼,你該不該接受店員的建議呢?
這個問題看似很簡單,兩個5英寸的比薩加起來應該是一個10英寸的比薩,比一個9英寸的還大,你可以佔點兒小便宜,但其實這個建議對你是非常不划算的。因為兩個直徑為5英寸的比薩的總面積要遠小於一個直徑為9英寸的比薩的面積!為什麼會這樣呢?
答案就在於圓的面積公式為S=πr2。當圓的直徑變成了原來的一半的時候,面積減少為原來的1/4,而不是一半。因此,兩個5英寸比薩的面積會是一個9英寸比薩的1/3還不到,如果你接受店員的建議,就吃了一個大虧。

披薩(圖/視覺中國)
這是一個隱藏在我們日常生活中的非線性規模法則的典型案例。所謂規模法則,就是指事物的某變量會與事物的規模呈現清晰的,通常是非線性的冪律關係。在這個例子中,我們用比薩的直徑來衡量它的規模,這樣面積就會與規模呈現平方的冪律關係,但是,我們可憐的大腦早已習慣了按線性的方式進行外推,從而掉入了這個非常隱蔽的陷阱。
事實上,這種線性思維錯誤是非常容易發生的,即使訓練有素的科學家也不例外。例如,在《規模》一書中,作者就提到了一組科學家因沒有認識到非線性規模法則而導致一頭名為圖什科的大象意外死亡的慘痛案例。
事情是這樣的:為了測試LSD這種致幻劑對大象的作用,科學家根據LSD在貓身上的正常劑量進行了簡單的線性外推,結果釀成了悲劇。他們以為,因為大象的體重大約是貓的600倍,所以,如果貓的LSD適用劑量是0.5毫克,那麼就應該給大象注射300毫克的LSD。結果,在300毫克LSD注射完之後的5分鐘內,大象圖什科開始大叫起來,轟然倒下,重重地摔向右側,排便,並進入持續癲癇狀態,然後在1小時40分鐘後就死了。這是一次沒有認識到非線性規模法則的慘痛教訓。
要想計算大象的適用劑量,我們需要認識到克萊伯定律,它指出生物體的代謝率會隨生物體規模(體重)遵守指數為3/4的規模法則。這意味着,當生物體的體重變為原來的600倍時,它的代謝率卻沒有提高到原來的600倍,而是原來的約121倍。生物體對LSD的消化與其代謝能力相關,因此大象能夠承受的劑量也是貓的約121倍,這要遠遠小於科學家對大象注射的劑量。
這種規模法則不僅適用於生命體,而且同樣適用於城市和公司。
《規模》一書中指出,隨着城市人口的增長,城市的基礎設施,如加油站數量、公路長度、總耗電量等並不會等速增長,而是比人口的增長速度更慢,這體現了城市的規模報酬遞減效應,也就是城市越大,基礎設施的使用效率會越高。更令人着迷的是,隨着城市規模(人口)的增長,人與人之間的交互和合作效應就會越來越明顯,因此也會創造越來越多的財富。例如,洛杉磯的人口差不多是費城的兩倍,但是洛杉磯所創造的財富比費城的兩倍還多,差不多是2.2倍。這解釋了為什麼大城市會比小城市更具吸引力,因為隨着城市規模的增長,人均財富也會隨之增長。

洛杉磯(圖/視覺中國)
同樣的規模法則也制約着大大小小的公司。我與聖塔菲研究所的克里斯·肯佩斯(Chris Kempes)及作者韋斯特的合作研究結果表明,新公司與老公司有着完全不一樣的規模法則。
對新創公司來説,它們的銷售業績會隨着公司的員工數的增長呈超線性增長,這意味着企業每多僱一名員工就會獲得更高的人均銷售業績。所以,新創公司充滿了創造超預期利潤的可能性,因此相對於那些呈線性增長的公司顯得更有活力。
對一些老公司來説,每增加一名員工就可能會得到相等或更低的人均銷售業績,這恰恰反映了每個大企業都害怕的“大企業病”。同時,它也解釋了為什麼像阿里巴巴、騰訊這樣的大公司都會在內部引入競爭機制,並鼓勵內部創業。這些公司希望模仿初創企業,讓員工通過類似集市一樣的自組織形成一個個小團隊,從而獲得超線性增長。
我與香港城市大學的吳令飛的合作研究還表明,即使是虛擬網絡社區也展現出了類似的規模法則。對那些自組織特徵明顯、表現非常活躍的網絡社區或論壇來説,隨着用户人數的增長,平均每個用户會創造更多的內容和活動;對那些不活躍、自組織特徵不顯著的社區來説,人均發帖量反而會隨着社區的規模(用户人數)的增長而減少。我們甚至可以用規模縮放的冪指數來衡量在線社區的黏性程度。這種黏性度量會消除時間因素和規模因素,可以刻畫在線社區的內在屬性。
從受限生長到奇點臨近
無論我們用什麼指標來度量,如長度、身高、體重、人口數、員工數等,任何複雜系統都有其特定的規模尺度,並起到極其重要的作用,因為幾乎所有的其他變量,包括生物體的代謝率、壽命、心率,城市的專利數量、犯罪率、基礎設施數量,公司的資產、收益、成本、盈利等都與其規模形成了規模法則。
《規模》不僅系統性地探索了這些普遍存在於各類複雜系統中的規模法則,還將它與其他已知的科學事實和規律相結合,為生物體、城市和公司構造了一個定量化的理論框架。在這一框架下,《規模》推導出了大量有意思的、令人吃驚的科學結論。
在眾多結論中,最有意思的一部分是規模法則會導致不同的生長現象。
為什麼所有的生物體在成年以後就停留在一個固定的尺寸而不再生長了呢?將規模縮放理論和生物體的能量預算方程結合起來,我們就能推導出所有生物體都適用的生長方程,該方程不僅能夠嚴絲合縫地擬合很多生物體的成長曲線——也就是給出體重隨年齡變化的精確定量關係,而且能夠回答為什麼所有生物體的生長會存在一個體重上的極限,它們長到一定程度就停止生長了。
問題的答案就在於生長速度的不匹配。
如果我們將生物體理解為一個大水缸,那麼它代謝攝入的能量就是流進水缸裏面的水,它為了維護、修復自身而消耗的能量就是流出的水,而它的體重就是水缸中的水。很顯然,生物體的成長就相當於水缸中水量的增長,它取決於淨流入量,也就是流入–流出。
現在,根據克萊伯定律,代謝率即流入量與體重的3/4次冪成正比,而流出量即生物體用於修復自身細胞消耗的能量與體重成正比。儘管在一開始流入量大於流出量,促進了生物體的快速成長、發育,但隨着體重本身的增加,流入量的增長速度會慢於流出量的增長速度(3/4小於1),這就是生長速度的錯配。因而必然會有這麼一個時間點,流入量剛好與流出量持平,生物體不再生長。
應用類似的生長速度錯配的原理,我們還能推導出哥斯拉這樣的超級巨獸是不可能存在的。因為它體重的增長速度是身高的3次方,而它的腿骨所能承受的支撐應力會隨着身高的2次方增長,3次方顯然快於2次方,所以必然有這麼一個規模點,哥斯拉自身的體重就會把自己的腿骨壓斷。

儘管城市的生長與生物體的生長遵循數學形式上一模一樣的方程,但由於城市的新陳代謝遵循超線性規模法則,城市呈現出了超指數增長——比指數增長還要快很多的一種生長模式,與生物體的受限生長簡直就是大相徑庭。理論還預測,城市會在有限的時間點達到無窮的規模。這意味着什麼?根據規模法則,社會財富、創新伴隨着犯罪和污染會以相同的速度趨於無窮大,我們進入了一個天堂與地獄混合的奇怪世界。
然而,為什麼我們從來沒有觀察到這樣的現象呢?韋斯特給出的解釋是,科技創新可以讓城市生長偏離既定的超指數生長軌跡,顛覆原有的社會經濟生態,從而“重啓”整個動力學過程,讓整個城市進入另一個方程相同但參數不同的新動力學過程。儘管新的生長過程仍會趨於超指數的臨界點,但它又會被另一次重大科技創新“重啓”。這一過程會一直持續下去。這也就是經濟學家熊彼特所説的顛覆式創新與超週期發展規律。
但是,故事還沒有結束。理論預測整個過程會以越來越快的速度持續進行下去。用韋斯特的話來説,我們不僅早已踏上了一台永不停止的跑步機,而且還會不斷跳到另一台速度更快的跑步機上。整個過程都在以指數的方式加速:雖然科技創新能夠一次次地解決原來超指數增長的問題,但是它不得不持續加速下去,從而導致任意兩次重大科技革命之間的時間間隔不斷縮短。我們的確體會到了這樣的過程:人類用了將近20年才完成互聯網革命,卻用了短短的5年時間就已經完成了移動互聯網革命。
持續的指數加速必然會讓人類進入一個不可避免的時間點——奇點。我們都知道,技術奇點這個概念最早是由美國數學家和小説家弗諾•文奇(Vernor Vinge)提出並由美國發明家、預言家雷•庫茲韋爾(Ray Kurzweil)發展與擴散的。他們根據摩爾定律進行外推,計算出奇點的準確時間就是機器的計算能力超越人類的那一刻。然而,這種能力的預估存在很大的爭議。
非常有意思的是,韋斯特採用了完全不一樣的框架,即通過超線性規模法則和生長方程也得出了相類似的奇點概念。
奇點臨近的時候會發生什麼?韋斯特對此報以悲觀的態度。不要希冀科技創新,它不是永遠的靈丹妙藥。與創新相伴而生的魔鬼——犯罪、污染等災難會讓人類社會進入一個崩潰的階段。這恐怕是本書揭露的一個最讓人沮喪與擔憂的問題。
內在網絡
一個理論不僅要展現數據,而且要給出機制性的解釋。為什麼規模法則具有高度普遍性呢?韋斯特給出的回答是,所有這些我們關心的複雜系統背後都存在類似的網絡,動物體內存在血管網絡,植物體內存在經脈網絡,城市內部存在公路網絡,公司內部存在通信網絡,在線社區上存在社交網絡,這些網絡的共性即普遍存在的規模法則。
如果你透過飛機的懸窗俯瞰夜晚的城市,就會發現道路網絡像極了人體內的血管,其中主幹道路就像大而粗的主動脈,大量小路就像毛細血管,奔馳的汽車就像血液。

資料圖來源:視覺中國
對生物體來説,韋斯特和他的合作者提出了著名的網絡模型,剖析了所有生物體背後普適的分形輸運網絡。大自然的進化迫使這些網絡不斷優化自身,使其不斷分叉、捲曲,甚至硬生生地“逼迫”出一個全新的維度出來。有了這個全新的維度,生物體就可以最大限度地利用它內部褶皺的表面去吸收營養物質以使它自身的新陳代謝效率最大化。為什麼生物體的規模法則中都存在那個神奇的數字“4”呢?這是因為所有生物體都像生活在一個四維空間中。
同樣的道理,城市、人類組織,甚至在線社區中普遍存在的超線性規模法則背後也是不變的基礎設施網絡或社會關係網絡。
早在300多年前,亞當·斯密就提出了“大頭針工廠”之謎:在人們按照各自的角色社會分工之後,工廠整體的工作效率會遠高於所有工人獨自工作的效率之和。其實,社會分工和合作就是在形成人與人之間的交互網絡。正是因為人與人之間的互動會隨着人數的增多而呈現更快速的增長,才會出現普遍的超線性增長規模法則。
例如,如果社會中任意兩個人之間可以發生隨機聯繫的話,那麼可能的連接數就會以人數的平方倍數增長,這已經體現了超線性的增長。只不過城市、在線社區等系統中的真實指數並非2,而是大多介於1~2之間,這説明現實的人類並不會任意相互聯繫,而會受到各種各樣的約束,從而使得連接數的增長快於線性增長而慢於平方增長。
聖塔菲研究所的路易斯·貝當古(Luis Bettencourt)等人的研究就指出城市中的人只能在道路這一“城市界面”上發生連接,故而城市中普遍存在1.15次冪規模法則。我與北京師範大學系統科學學院的李睿琪和王文旭等人,以及香港城市大學的吳令飛的研究表明,城市及在線社區的生長還受限於其生長的方式,即一個新成員的加入必須要與老成員相互鄰近,於是給出了GDP(國內生產總值)、創新等指標的1.15次冪規模法則的不同解釋。這裏的鄰近可以是真實的地理空間鄰近,也可以是人們頭腦中的興趣空間鄰近。
人工智能時代是否需要牛頓
然而,我們現在取得的成績還遠遠不夠。我們呼喚新時代的牛頓。
1601年的某天晚上,丹麥天文學家第谷•布拉赫(Tycho Brahe)撒手人寰,把自己長達20多年來積攢的行星運行數據留給了助手約翰尼斯•開普勒(Johannes Kepler)。經過20多年的探索,開普勒終於將這大量的數據總結提煉成精確的方程,即開普勒定律。又過了20年,牛頓站在開普勒、伽利略等巨人的肩上,提出了萬有引力定律和牛頓運動定律。至此,經典力學革命爆發。牛頓力學與開普勒定律的本質區別在於後者的應用範圍僅僅侷限於太陽系,而前者的適用範圍則包括了宇宙中的一切具備質量的宏觀物體。這就是定律(law)與力學(mechanics)的區別。
“mechanics”在英文中不僅有力學的意思,而且包含了事物背後的運行機制和基本原理。我們今天所面臨的局勢很像當年開普勒所面臨的。隨着大數據的發展,我們已經積累了有關生物體、城市、公司的大量有價值的數據。克萊伯定律等規模法則的提煉則可以類比為開普勒的發現,這些實證規律清晰地向我們揭示了複雜系統背後的統一性和規則性。然而,再多的實證統計規律都無法與一條清晰、簡單的力學原理相媲美。我們呼喚新時代的牛頓。
有人認為大數據、人工智能時代將不會再次重複牛頓時代的英雄故事,我們不需要理解事物背後的基本原理和因果關係,單純地依靠大數據的模式挖掘就能解決所有複雜問題。物理學家出身的韋斯特卻並不這樣認為,“大數據時代更需要大理論”,他一針見血地指出了當前大數據、人工智能研究範式的弊端。如果沒有對事物運行背後的力學機制的基本思考,我們就很容易誤入歧途,浪費大量的算力。
這就是《規模》背後的基本精神和態度,追求至高無上的基本原理和邏輯框架,而不是隨波逐流。它就像注入人工智能時代的一股清流。

《規模:複雜世界的簡單法則》
[英]傑弗裏 • 韋斯特(Geoffrey West)
中信出版社,2018-6出版