ChatGPT大後方_風聞
秦朔朋友圈-秦朔朋友圈官方账号-03-01 08:50

· 這是第5069篇原創首發文章 字數 6k+ ·
· 上官芸 | 文·
過去幾周ChatGPT成為新的熱點,美團聯合創始人王慧文老師發出招賢榜投入中國OpenAI事業,北京迅速出台針對性政策鼓勵科技龍頭企業打造中國ChatGPT,香港高校命令禁止以ChatGPT輔助作業和考試作弊的行為……
更有諸多花絮為人津津樂道,ChatGPT的發起人最初是基於AI不應該為大公司壟斷的出發點,創立OpenAI;OpenAI引入微軟投資,設計了獨特的回報機制,既保護投資人利益,又保持OpenAI獨立性和長期機制……
很多立場清晰的評論人士又擔心起來,我們是不是又被美國帶節奏了,為什麼中國人工智能行業沒有率先出現這樣的重大突破……
這個話題很大,我們試着從一個小視角切入,用非技術的語言,來聊聊區塊鏈、聯合學習、大模型訓練和ChatGPT。
西方教育體系擅長從提出一個問題出發,抽絲剝繭拆解出解決問題的一系列具體步驟、知識和方法。我國教育體系則比較擅長提出一個概念,再層層解析這個概念的內涵和外延,繼而舉例説明這個概念的應用範疇,再通過練習強化。
你看,這像不像技術演進中的兩種思路:前者提出一個較長遠的目標,分解實現這個目標的技術關隘和關鍵節點,集聚資源逐一突破;後者是解讀當前熱點和近期趨勢,選定一個技術定位,圍繞這個定位驗證場景、複製場景、強化練習。
兩種方法各有利弊,前者顯然更具有前瞻性,但風險也更高;隨着我們的技術迭代加速,需要逐步從後一種模式切換到前一種模式,形成引領性的技術攻關路線。
那麼,這和ChatGPT有什麼關係呢?
如果我們去調研一圈國內的AI公司在大模型訓練上的卡點,就會發現,實際上並非算法設計和樣本量上有遙不可及的差距,而是對取得這一技術點突破所需要的資源投入沒有足夠的信心魄力。
真正的問題在於,Sam Altman等人並沒有被自身資金和資源限制,他們提出對的問題後,集聚了適合的資源(包括馬斯克等一批投資人和微軟這個大場景方)。並且在模型樣本和訓練上,OpenAI充分發揮了用户端力量,用一個直面C端的產品擊穿流量,讓用户願意花錢來輔助訓練。
而國內的模型訓練,卡在“什麼是大模型訓練、如何訓練、需要多少資源、投入資源的回報確定性如何”這樣的概念分解困局裏。這就是思維模式帶來的實現架構的差別,也帶來了OpenAI在“解決問題”層面的成功。
這樣的例子並不是第一次發生,大家可以看看馬斯克的邏輯結構,他是如何介入火箭、衞星網絡、電動車、太陽能等完全不同的領域的,以及多年前Google如何用“聯邦學習”調動全球用户幫他們做了哪些有趣的訓練,稍微查一查資料就會發現其中的模式和方法都有跡可循。
關於思維模式和教育理念的話題,在此不作展開。但是這種協作式訓練的技術架構,是非常有借鑑價值的。
在計算機相關技術出現和蓬勃發展的數十年裏,我們一直在“單點計算”和“多點組網”兩個維度上不斷迭代。
ChatGPT和第三代區塊鏈恰恰是這兩個維度的發展里程碑。可以説,ChatGPT之於人工智能的意義,相當於蒸汽機之於工業革命,而第三代區塊鏈之於互聯網絡的意義,亦可同等比擬。


人腦的有限性
從本源來説,人類一直在試圖用科技創新來對抗自身的三種有限性:
-身體能力的有限性
-生命時間的有限性
-認知體驗的有限性
奧林匹克競賽是對人類突破身體能力極限的追求的縮影,人類還不斷通過生物技術、機械動力技術、人工智能技術發展代替人類,突破自身物理極限。
人類生命時間的有限性體現為兩個方面:
一是壽命的有限性,導致經驗和教訓不可能無損傳承,每一代人總要在自我論證中走進歷史的峽谷;
二是生命的單維體驗,人不能同時踏進兩條河流,因此只能作出選擇,彼此合作。
認知方面,人腦的“單機”算力其實不差的,相比超級計算機(例如我國的神威太湖之光:93.01 PFLOPS),一個人的大腦計算能力約是超級計算機的1/46,在2 petaFLOPS左右;而且在能耗方面,人腦還具有明顯優勢,一台超級計算機的耗能足夠供給一整棟大樓,而一個人腦的耗能,約等於點亮一個燈泡。
人腦的算力=神經元個數(10^11個)*單個神經元連接數(10^4個)*單個連接的激活速度(2OPS/個)。
人腦的短板在於存儲。如果研究人類存儲的需求,我們會發現類似的時幀估計。某一領域的專家掌握的知識塊的數量大約是10^5個。這些塊包括模式(如知識面)以及具體的知識。
在《人腦能承載多少知識》的分析中,有一些數量級可以參考——
一個世界級的國際象棋大師估計掌握了約10萬局棋譜;
莎士比亞的詞彙量為2.9萬,但這些單詞所能表達的含義總數接近10萬個。
醫學專家系統的開發表明,人類在某一領域可以掌握大約10萬個概念。如果我們估計該“專業”知識只佔人的知識的1%,那麼人的整體知識塊大約是7個。
在存儲類似知識塊的系統中,不管是基於規則的專家系統,還是自組織的模式識別系統,其中的每個知識塊都需要10^6比特,這樣實現人的功能存儲需要10^13(10萬億)比特。
為了存儲連接模式和神經遞質的濃度,我們可以估計每個神經連接約需要10^4比特。因此存儲10^14個神經連接就需要10^18比特。
基於以上分析,目前模擬人腦功能的硬件約合1000美元。具有複製功能的軟件還將需要大約10年或更長的時間才會出現。不過,硬件的性價比、能力以及速度的指數級增長將在此期間一直延續,所以到2030年的時候,價值1000美元的計算機將會達到一個村莊的人(約1000人)的腦力。
而到2050年時,1000美元計算機將超過地球上所有人類大腦的處理能力,當然,也包括那些仍然只應用生物神經元的大腦。
人的認知和體驗的侷限在於,人腦接收的信息源極其分散,而人腦的調度機制、反饋機制和獎賞機制,僅能支撐人類原始狀態下的生存和安全需要,對於近現代文明中湧現的新需求毫無天然優勢。人類有限的算力和存儲很難優化配置。每個人都是他/她過往一切的綜合。但是,人類的過往在基因中的顯現是大大滯後的。因此我們不斷通過“外腦”來輔助認知,也就是近年來人們常説的碳基生命和硅基生命的依存關係。


關於第三代區塊鏈
再説説區塊鏈,這個既熟悉又陌生的技術。絕大多數人知道區塊鏈是因為“炒幣”,後來又因為全國各地如火如荼的區塊鏈應用創新示範。但很可惜,這兩種區塊鏈,都離我們普通人的生活體驗很遠。
有趣的是,2021-2022年海外的NFT大火,國內出現了類似的基於區塊鏈的產品“數字藏品”,讓至少數百萬中國普通網民重新認識了區塊鏈。但是這個行業仍然是良莠不齊、譭譽參半。
事實上,當前中國的區塊鏈行業正在進入第三個階段,我們姑且稱為“第三代區塊鏈”:
第一代主要發展於2009~2018年,以比特幣、以太坊為代表,金融模型推動和虛擬貨幣結合的發展時期;
第二代主要是2016年至今,以螞蟻鏈、趣鏈、長安鏈等為代表,政策推動的私有鏈和聯盟鏈項目型推廣期;
第三代則是2021年下半年至今,以BSN、光箋鏈等為代表,數字資產流通需求推動的區塊鏈網絡發展期。
第三代區塊鏈以廣義數字資產承載為基本功能,向上提供適合分佈式架構和服務端分離的場景服務。
為什麼會出現第三代區塊鏈呢?我想有幾個原因:
一是包括中國在內的大型主權國家,經過數千年大一統國家的金融體系構建和治理經驗,深知主權貨幣的必要性不可撼動,因此無法接受某種虛擬貨幣危及法定貨幣的價值,有興趣的讀者可以讀讀《中央帝國的財政密碼》一書,深入淺出回顧了中國歷史上的財政體系構建經驗;
二是區塊鏈技術是一種早期技術,國內開發者人才仍然供不應求,僅僅以項目交付方式提供給某個大型企業,很難被重視、被充分維護和使用,最終必然流於形式;
三是隨着全社會數字化建設水平不斷提高,多元的數字化資產流動成為經濟活動中越來越重要的價值支撐,同時技術分工專業化,需要一種專業的、打破主體邊界的底層技術,為跨域數字資產流通提供技術設施和服務。
很多人知道,公有區塊鏈的經濟系統中有個關鍵要素叫Token,被翻譯為“通證”,或者“代幣”。但是,在密碼學學科語彙中,它其實還有個名字,叫“令牌”。區塊鏈系統很巧妙地把信息傳遞、記錄的過程用“令牌”串聯起來,就好像有個領班帶着“令牌”為信息開路。
擁有“令牌”越多可以傳遞的信息就越多,那麼在信息傳遞的世界裏,這種“令牌”就成為一般等價物,也就具備了“貨幣”價值。公有鏈正是利用這個原理,將“令牌”作為募集資金的錨定物。這種“令牌”從技術原理上來看,總量恆定、流通量可監督,不能增發只能通縮,就不需要權力機構的背書而成為一種基於技術信任的貨幣。
本來,央行出於維護金融秩序穩定的目的已經取締了“令牌”的貨幣和募資錨定功能,區塊鏈的激勵機制失靈,失去了魔力而退化為一種普通的技術分支。但是在數字資產流通趨勢的催化下,區塊鏈體系中又生長出一種“局部令牌”。
這種局部令牌不再試圖充當一般等價物,而僅僅錨定一種局部認同的具體資產價值,成為一種數字世界的“目標物”或者“商品”。這種局部令牌對主權貨幣和主流金融體系不再構成危害,甚至可以促進實體經濟中的數字化流通,促進經濟體的M1容量和活性。
例如,走入大眾視野的NFT,就是一種典型的局部令牌,事實上它成為數字藝術品、品牌數字權益等有價資產的數字化表達,提高流通效率,降低流通成本,形成新的供需市場。
是不是一定需要區塊鏈來實現這些功能呢?不一定。我們先把概念放一邊,用“解決問題”的思路來分析。
一些數據或用數據表達的資源經常被使用,擁有數據的一方需要對數據定價、授權給別人使用、要求使用方付費、監督使用方的使用範圍,而需要數據的一方也想確認數據的真實性、合法性,那麼就需要一種網絡來對數據提供確權(屬於誰)、定價、溯源、流轉記錄等功能,這些功能組合在一起恰好是區塊鏈,它的設計精巧、簡潔、高效地實現了這些訴求。
從計算機出現至今,單機處理能力和網絡協作能力一直是計算機技術介入社會經濟程度的兩大衡量維度,全球市值最高的計算機和互聯網企業不外乎這兩類能力的代表。
從硬件角度提高單機計算速度的英特爾、AMD、英偉達、高通,到提高單機軟件處理能力的微軟、蘋果,再到提高網絡協作能力的亞馬遜(雲計算)等,以及橫空出世的馬斯克系列公司,無外乎都是在單機算力(特斯拉、Neuralink)、組網能力(Paypal、星鏈)方面作出突破。
計算機技術發展的早期,主要聚焦於單機算力。1946年2月14日,由美國軍方定製的世界上第一台電子計算機“電子數字積分計算機”(ENIAC Electronic Numerical And Calculator)在美國賓夕法尼亞大學問世,ENIAC是美國奧伯丁武器試驗場為了滿足計算彈道需要而研製成的,這台計算器使用了17840支電子管,功耗為170kw,其運算速度為每秒5000次的加法運算,造價約為487000美元。
ENIAC的問世具有劃時代的意義,表明電子計算機時代的到來。在以後60多年裏,計算機技術以驚人的速度發展。
計算機技術發展的第二階段是在同一物理環境或同一管理主體內形成多台計算機組網能力,並逐步提高傳輸效率,形成較大範圍的經濟活動上的協作。
區塊鏈技術的出現和發展,是網絡協作能力象限內的重大轉折。把儘量多的網絡空閒資源充分調動,降低信任成本,形成更廣大範圍的經濟協作和技術協作。
也就是説,前一個階段的協作是單點或一個集中點位計算能力極大化後,再借助網絡做傳輸。區塊鏈的協作是把計算和存儲任務本身進行分解,全網協作,還順帶處理好了協作上的分配機制等問題。
可以説,第三代區塊鏈將是計算機技術走向下一程的重要加速器。具體而言:
**其一,政策方面。**隨着科技的發展、數字化建設不斷深化,數據價值的挖掘得到全社會的重視,整個社會的數字化智能化需要大量實時、持續、合規的數據供給。
而《數據安全法》和《個人隱私保護法》等系列法律法規陸續執行,從立法高度對數據分類分級和數據生命週期管理提出新的要求,如何在生產中調度數據、如何在使用中保護數據成為諸多智能化場景進化的癥結和難點。
**其二,產業方面。**互聯網行業和人工智能行業的發展,打破資本驅動的巨無霸式擴張模式,開放生態互聯互通成為可能。例如,騰訊、阿里、商湯等多家大型科技公司主動遴選優秀的技術夥伴,為自身業務場景賦能,而多家產業巨頭可以同時共用一組區塊鏈網絡。
**其三,技術方面。**技術分工精細化,單點技術演進的難度越高,並行和聯合的效率就越高。而區塊鏈將成為解決數據流通和數字資產交易的關鍵設施,專業分工的技術公司,將為分佈式算法和算力提供新型網絡平台,提供多點並行和聯網演進的必要設施。
在過去一年多時間裏,數字藏品行業已經做出了示範,第三代區塊鏈幫助創作者的價值得到保護和快速定價,在AI訓練、電子票據流通、自動合約結算、數字權益核銷、文書認證等方面,區塊鏈將發揮更廣泛的支撐作用,成為承載廣義數字資產確權、交割、定價的關鍵技術。


關於ChatGPT
ChatGPT是在人們透支了對人工智能行業的想象力之後,出現的“新寵”,實際上是自然語言處理(NLP)能力和聯邦式大模型訓練架構的重新詮釋,其創新更多在於資源組織和產品表達方面,也可以説是一種用終端用户直接驅動的自然語言處理進化方式,是人工智能算法訓練的一種新的解題思路。
人工智能是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能作為計算機科學的一個分支,它企圖瞭解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。
人工智能可以對人的意識、思維的信息過程進行模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。
ChatGPT讓這種智能觸手可及,成為普通用户可觸及、可感知、可應用的能力,將會像5年前的圖像處理和視覺識別一樣逐漸成為成熟的可廣泛應用的工具和組件,融入我們的各種生活場景,特別是在陪伴式對話和生成式創作領域。
最終,人工智能技術和經濟系統的關係還有兩個影響因子:
**一是單位信息價格。**過去三十年在摩爾定律指導下硬件價格不斷下降、處理能力不斷提高,計算終端日益普及,計算機系統帶來的單位信息價值獲得了社會財富的灌溉。沒有任何一門其他技術可以比擬計算機,性能價格比能在30年內增長6個數量級。
**二是單位信息能源效率。**雖然單位信息價格中包括佔用的能源成本,但是能源作為一種特殊的資源要素,又是驅動信息系統運轉的必需資源,未來處理信息需要消耗的能源資源,將成為一個獨立的考量。
人工智能的通常路徑是結構化數據、數據標註、算法訓練,而大模型訓練可以在無標註情況下做自監督學習。在大模型基礎上只要疊加一些局部小模型做二次訓練,就可以快速新成新的能力。
為實現這種效果,ChatGPT要花費每次高達140萬至1200萬美金的訓練成本,按月訪問量1300萬計算,初始投入8億美金,每日電費達5萬美金,計算資源投入達千億美金。
面對高昂的算力成本,AI行業可能束手無策,但是區塊鏈最不缺的恐怕就是算力了。“挖礦”是一項極其困難的任務,需要大量的電力和金錢來鋪設算力才能完成,結果全球“礦友”們以各種形式尋覓能源價格窪地,發明不同算力“礦機”,曠日持久地“挖掘”。
如果將分佈式冗餘的算力重新組網,完全可以為AI訓練提供低成本方案,反過來,AI已經被證明是優化能源消耗的有效手段,提供類似的解決方案應用在區塊鏈。這也許會導致硬件資源方面的投資下降。
區塊鏈能為人工智能行業帶來光明的前景,反過來人工智能也可以為區塊鏈加油助威。德勤在2016年估算區塊鏈驗證和共享交易的總運行成本大概是每年6億美元左右。
一個智能系統或許實時計算出某個特定節點成為第一個執行特定任務的節點的可能性,讓其他礦工有可以選擇放棄針對該特定交易的努力,從而削減總成本,減少無用功的付出,以此提高效率。
人工智能繼續演進所面臨的挑戰:
一是數據質量問題;
二是數據共享的機制問題;
三是算力等資源投入問題。
在數據中心化的前提下,數據的使用方式也缺乏透明度,當數據提供者無法對自己的數據進行有效管理時,很多人都選擇不再進行數據分享。而區塊鏈恰恰可以解決這一問題。
在鏈上,每一份數據的上傳者、使用流向和成果都有跡可查。用户對數據擁有所有權和自主使用權。數據上傳者還會收到使用方提供的局部令牌作為補償,當用户能夠將自己產生的數據變現,並可控制數據流向,相信會有更多的人願意提供相關數據。
對於AI來説,安全的數據共享意味着更多高質量的數據,然後就會有更好的模型,更廣泛的數據網絡和創新形態。甚至可以通過區塊鏈跟蹤多數據源質量,從而給予高質量數據源以激勵和自動結算。
ChatGPT和第三代區塊鏈可以説是計算機技術發展的兩個里程碑:前者是在單點能力上發力,在中心化組織的數據平台上培育去中心化的智能;另一個則是在組網能力上發力,在充分共享的數據環境下促進去中心化的應用。
但兩者天然優勢互補,在人工智能為區塊鏈提供更強大拓展場景與數據分析能力的同時,區塊鏈技術可為人工智能提供高度可信的原始數據以支持其持續的“深度學習”。
人類本身就是一種進化體。基於對物種壽命、認知、體能等各個維度的有限性的理解,我們從古早時代就學習構建協作體系。在計算機智能的世界,單點算力有限、算法進化效率有限,需要一種協作網絡提升單位信息價值、降低單位信息能源消耗。
這就是第三代區塊鏈和ChatGPT(乃至廣義人工智能)的關係。

作者:零幺宇宙創始人,信息安全專業出身,互聯網技術和區塊鏈行業從業者。