DeepSeek崛起:穿越硅基文明臨界點_風聞
尺度商业-3小时前
文 | 李德林
美國總統特朗普坐在橢圓形的辦公桌前,一改往日的自信,説:“這是我們行業的警鐘,我們需要專注於與中國的競爭。”距離1月21日,特朗普在白宮跟日本首富孫正義見面,開啓“星際之門”只有10天時間,DeepSeek猶如12級颶風排山倒海刮過白宮,擊碎了白宮在人工智能築起的籬笆牆,DeepSeek引發的人工智能之變,讓2025年穿越硅基文明的臨界點。
英國人的天氣預報一直有4箇中國城市:北京、上海、廣州和綿陽,綿陽作為擁有核物理、空氣動力、光機電一體化等多個前沿領域的科技城,備受世界矚目。現在,恐怕英國人的天氣預報要增加一個城市:杭州。2025年的春節,杭州成為全球關注的焦點,除了機器人在春晚節目上跳舞,還有創造黑神話的遊戲科學、數據集羣核科技,更有幻方DeepSeek。
如果説杭州的阿里巴巴集團跟美國在互聯網商業方面進行過阻擊戰,最終遙遙領先,那麼幻方為首的人工智能等硬科技的崛起正在進入一個新時代。幻方作為量化資本,按照魯迅先生的説法,擁有“把世上一切不一致的事物聚在一堆,以他自己的模型來使他們織成一致”的能力,幻方把在資本市場的聚合模型化能力運用到人工智能,讓美國人驚訝不已。
DeepSeek何以讓美國人驚訝?
DeepSeek採用了動態神經元激活機制和混合精度量化技術,顯著降低了計算量和模型體積,提升了推理速度和效率。在DeepSeek之前,OPenAI旗下的ChatGPT一直是人工智能領域的王者,中國的巨頭們都是ChatGPT的跟隨者,他們都從基礎數據訓練開始,而DeepSeek的跨模態學習框架和自研適配技術使得模型在多模態數據融合和學習方面具有獨特優勢。
DeepSeek的推理性能和快速的問題解決響應速度,性能比肩GPT-4。其模型在推理階段僅激活5%-15%的神經網絡參數,相比傳統稠密模型降低80%計算量,單位算力下實現300%吞吐量提升;相較於ChatGPT他們動輒幾億甚至幾十億美元的訓練成本,DeepSeek的訓練成本只有557.6萬美元。因為DeepSeek專門編程了每個H800上132個處理單元中的20個來管理跨芯片通信,提升了跨芯片通信的效率,超越了巨頭們通過芯片堆積的數倍效率。
特朗普重返白宮後,將人工智能上升到美國國家戰略的高度。其將資本巨頭孫正義、OpenAI、甲骨文三方聚合在一起,宣佈了“星際之門”的人工智能項目,計劃投資5000億美元,以期提高美國在人工智能領域的壟斷地位。商人出身的特朗普有着自己的算盤,OpenAI擁有領先的ChatGPT技術,孫正義代表日韓,拉攏中東資金,甲骨文擁有全球領先的數據庫系統。如此一來,美國通過技術、數據、資金,將在人工智能領域遙遙領先,一統江湖。
美國有兩位總統都是個異數,一個是里根,一位好萊塢演員;一個是特朗普,一個在好萊塢星光大道留下手印的商人。里根當年面臨的對手是強大的蘇聯,他的策略就是通過爭霸空間的計劃,以高科技競爭拖垮蘇聯經濟。美國發展航天飛機、阿波羅登月計劃等,蘇聯發展空間站、人造衞星等。最終,美國的掉主遊戲成功。現在,特朗普企圖重演里根的策略來對付中國,沒想到星際之門計劃剛一推出,DeepSeek的颶風就摧毀了特朗普的如意算盤。
美國軍事人員早在2024年的秋天就已經搭乘上DeepSeek這趟在馬斯克眼中的二路汽車了。DeepSeek強大的推理能力讓美國的敏感部門興趣濃厚,尤其是美國的國防部信息系統局、美國海軍都率先下載了DeepSeek較早的版本。DeepSeek衝到美國應用下載榜首後,五角大樓以DeepSeek涉及所謂“安全和道德問題”,上升到“國家級漏洞”而下達禁令。
五角大樓對DeepSeek採取了封殺,因為以英偉達為首的七姐妹撐起了美股的指數。DeepSeek的爆熱首當其衝的就是英偉達的芯片。按照ChatGPT的玩兒法,人工智能就是大力出奇跡,通過大規模的芯片堆積來實現超級算力。美國通過限制先進製程的芯片來阻擊中國人工智能的步伐。星際之門正是在這樣的邏輯之下進行的,可DeepSeek小米加步槍反殺了。
英偉達為首七姐妹暴跌,動輒就是上萬億美元市值的灰飛煙滅,令特朗普難以接受。要想讓美國再次偉大,如果七姐妹崩潰了,美國在跟中國的科技競爭中難以繼續保持領先優勢,那麼美元的全球領導地位將會動搖。特朗普認為中國企業崛起意味着美國企業不需要投入大量資金建立低成本的人工智能選項,他把黃仁勳召進白宮,討論進一步收緊AI芯片出口問題。
美國除了對DeepSeek進行限制外,以馬斯克為首的美國精英分子嘲笑DeepSeek採取了蒸餾技術。模型蒸餾説的直白一點就是,學生向教師模型發送輸入並記錄輸出,然後用這些數據來訓練學生模型。其實,在模型訓練方面,蒸餾技術是普遍存在的。比如,微軟通過蒸餾技術來優化他們用於面向消費者應用的推理模型。這也是微軟跟OpenAI逐漸分道揚鑣的核心經濟因素,自然對投資1000億美元來建設數據中心訓練前沿模型的熱情就不高了。
無論是微軟,還是蘋果,他們對DeepSeek這樣的開放模型,以及蒸餾技術都是持歡迎態度的。因為消費應用場景下的蒸餾技術可以優化他們的產品,在1000億美元折舊之前就被商品化了。為啥還要像星際之門計劃那樣砸下幾千億美元去訓練基礎模型,最後還要在商品化的過程中不斷折舊,吞噬公司的鉅額利潤呢?當特朗普緊張的時候,庫克在擁抱DeepSeek。
商人更應該看到歷史的趨勢。今天DeepSeek颳起的人工智能颶風跟當年蒸汽機的發展過程如出一轍。早在1世紀,古希臘數學家希羅就發明了蒸汽機雛形汽轉球。到了1679年法國丹尼斯.巴本發現蒸汽衝開了他的高壓鍋後,製造了第一台蒸汽機工作模型。20年後的1698年,英國人在巴本的基礎上製造出第一台礦井抽水蒸汽機,1764年瓦特改良了蒸汽機。
蒸汽機的技術經過幾千年的演變,尤其是18世紀短短半個世紀的飛躍發展,成為人類歷史上的一個重大里程碑。它引發了18世紀的工業革命,顛覆了以西班牙、葡萄牙為主的舊的世界霸權格局,大規模進行蒸汽機應用的英國成為了日不落帝國。蒸汽機引發第一、二次工業革命,而20世紀四十年代以原子能、電子計算機的發明和應用,美國成為新的領頭羊。
不難發現,從蒸汽機到原子能、計算機,所有的技術都是不斷在前人的基礎上推進的。猶如中國唐宋時期發明的火藥,到明朝末年,明清雙方在戰場上還是通過採購葡萄牙的紅衣大炮來武裝各自的軍隊。馬斯克最不應該嘲笑蒸餾技術,因為中國人胡國光在1922年就造出了世界第一台電動汽車,胡國光的電動汽車一次可行駛30-50公里,開放的技術推動世界進步。
如果説能源的變革是碳基文明向硅基文明躍升的初期,那麼人工智能的崛起將是穿越硅基文明的臨界點。DeepSeek通過巨大的成本優勢讓商業化變得唾手可得,猶如瓦特改良蒸汽機,大大的提高了蒸汽機的效率,推動了工業革命的進程。DeepSeek猶如當年瓦特改良的蒸汽機,瓦特沒有成為世界首富,他卻給出了一把打開未來之門的鑰匙,人工智能到了飛躍的臨界點。
人工智能高昂的研發成本和複雜的技術門檻一直是制約創新的關鍵,DeepSeek的出現打破了這個僵局,加州大學伯克利分校的一個研究團隊僅以30美元的成本,成功複製了DeepSeek R1-Zero的核心功能,並推出了名為TinyZero的開源項目。斯坦福、港科大等大學都在複製DeepSeek,一直以國家行動進行仿製的印度也在DeepSeek的基礎上開始複製。
特朗普現在除了各種禁令,召集芯片巨頭們密謀,現實就是美國總統阻擋不了中國人工智能的步伐。DeepSeek引發的蝴蝶效應已經在全球如火山爆發,人工智能不再是巨頭們壟斷的專利,而變成全人類的福音。硅基文明真正到來的標誌就是人類共同擁抱人工智能。面對DeepSeek引發的人工智能之變,也許,老百姓會説,他們真是雨後的春筍,節節高升。