中國量化高手在對沖基金動盪中打造了DeepSeek - 彭博社
bloomberg
DeepSeek 現在威脅要顛覆全球人工智能供應鏈。
攝影師:安德烈·魯達科夫/彭博社三年前,梁文峯的量化對沖基金公司因在中國股市動盪期間虧損而向投資者深表歉意。
這對浙江高飛資產管理公司來説是一次令人驚訝的失誤,該公司利用人工智能選股,並迅速成長為全國最大的量化基金之一。在公司經歷那場 危機,其資產從超過120億美元的高峯縮水超過三分之一的同時,梁在幕後為一個新的人工智能初創公司 DeepSeek 打下了基礎。
DeepSeek 源於高飛,現在威脅要顛覆全球人工智能供應鏈,並挑戰美國在關鍵前沿人工智能技術方面看似不可動搖的領先地位。這家成立20個月的公司的突破性技術及其同名應用程序的突然 受歡迎程度 引發了週一美國和歐洲股市的巨大拋售,近 $1萬億 的市場價值從芯片巨頭 Nvidia Corp. 和其他同行身上蒸發。
這也引起了人們的震驚和敬畏,因為梁是一位工程專業畢業生,從未在中國大陸以外學習或工作,卻能完成如此壯舉。他證明了在當地人工智能工程師、受限的最新半導體技術和有限資源的情況下,能夠與該領域的佼佼者相匹敵,甚至超越他們。
| 瞭解更多關於DeepSeek的信息: |
|---|
| 關於DeepSeek及其低成本AI模型的所有信息:QuickTake |
| 人工智能推動的股票反彈遭到中國新興企業的1萬億美元打擊 |
| DeepSeek展示了中國如何對美國造成更大沖擊的策略 |
| DeepSeek顛覆了硅谷對AI成本的假設 |
“世界上每個國家都可以開展這樣的項目,只要他們能夠獲得人才並能夠進行相關工作。當然,其他行業將從中學習,” Shuman Ghosemajumder,位於舊金山的AI初創公司Reken的聯合創始人兼首席執行官説。
現在吸引投資者、公司和政策制定者關注的問題是,人工智能是否需要數千億美元的資本支出才能推出最新的創新和前沿AI模型——以及出口管制是否能夠阻止中國的競爭。
## 大視野
DeepSeek的恐慌
17:26
梁被比作OpenAI創始人山姆·阿爾特曼,但這位中國公民保持着更低的個人曝光率,鮮少公開發言。“OpenAI不是神,不能總是處於前沿,”梁在2024年7月對中國媒體36Kr説道。
前一年,梁表示更多的投資不一定會帶來更多的創新。他還評論了中國公司長期以來主要是跟隨者而非技術創新者的問題。他被引用説:“問題在於缺乏信心,不知道如何組織高密度的人才以實現有效的創新。”
DeepSeek應用程序。攝影師:林奕/Bloomberg### 一個異類
梁於1985年出生在中國南方廣東省的一個經濟貧困城市湛江。他的父親是一名小學教師。他在 浙江大學學習電子工程,這是一所位於杭州的著名大學,並在那裏獲得了信息與通信工程的碩士學位。
高飛者在中國的量化行業中與DeepSeek在全球AI行業中的地位一樣,都是一個異類。
梁和他的兩位前大學同學在2008年開始涉足國內股票。與大多數中國量化基金的創始人不同,他們都沒有海外或機構交易經驗。
這三人嘗試了從自主交易到套利的不同策略,最終在2015年成立高飛者時決定採用系統化的方法來實施交易理念。他們最初建立了一個基於價格和成交量因素的模型,然後在2016年嘗試機器學習。
這項新工具使公司能夠更深入地挖掘新因素,並識別因素之間的“非線性”關係,首席執行官Simon Lu在2020年的一次採訪中表示。創始人在2018年將機器學習整合到高飛者的產品中。
根據2020年該公司的宣傳冊,人工智能使高飛者實現了“許多創新”,並開發了一個多策略、多週期的投資模型,以“堆積”來自不同收益來源的回報。其旗艦產品以CSI 500指數為基準,整合了低風險策略,如日內交易,使其在過去三年中以合計120個百分點的優勢超越該基準。
因此,高飛者迅速增長資產,2021年資產超過900億元,但在同年晚些時候遭遇挫折。
2021年12月,在一些基金經歷創紀錄的回撤後,高飛者表示其人工智能在某些交易時機上出現失誤,並在大幅波動期間表現不佳。“我們感到非常內疚,”它告訴投資者。該公司還停止接受新資金流入,並表示將減少其管理資產並調整其策略。
三個月後,其市場負責人警告某些對波動敏感的客户應該 贖回他們的資金——這是一個非常不尋常的舉動。
去年,高飛者表示將逐步停止對市場進行雙向押注的產品,並 專注於“僅做多”策略,即只對股票採取看漲的立場。其管理的資產已降至約600億人民幣。
研究資金
梁之前表示,DeepSeek的研究由高飛者的研發預算資助。它從量化基金中獲取計算資源,該基金在2021年積累了10,000個Nvidia GPU,此前美國對出口先進Nvidia芯片和其他圖形處理單元實施了禁令。
梁幾乎完全從中國招募工程人才。許多人剛從頂尖大學畢業,正在進行博士研究的最後階段實習,或是奧林匹克獎牌獲得者。
“他是個書呆子,但在這個背景下,書呆子並不是負面的,”西漢·王説,他是 西北大學的博士生,2024年在DeepSeek進行了六個月的實習。
王表示,梁自己進行了許多實驗,DeepSeek的運作方式很像一個研究實驗室。“它起步較小,但隨着他們取得真正的進展,他們開始變得興奮,”他説。
這家初創公司開始定期發佈模型,似乎對美國對尖端AI加速器芯片的出口禁令無動於衷——甚至受到刺激。
DeepSeek於1月20日發佈了其R1高級人工智能推理模型,恰逢唐納德·特朗普宣誓就任美國第47任總統的同一天。
在那個星期一早些時候,梁參加了在北京舉行的由中國總理李強主持的閉門商業研討會。根據官方的新華社報道,來自技術、科學、教育等領域的專家們為政府工作報告草案提供了意見和建議。視頻資料顯示梁坐在李的對面發言,而中國領導人則專注地點頭。
值得注意的是,DeepSeek將其R1開源,允許研究人員和開發者自由使用、修改和商業化該模型。這發出了一個信號,表明它希望與全球人工智能社區的其他人合作和創新。
梁在中國企業家中脱穎而出,因為他有着非商業目標,專注於研究和實現通用人工智能,麻省州梅德福的塔夫茨大學技術政策助理教授托馬斯·啓通·曹表示。
據彭博億萬富翁指數,梁被認為擁有高飛者51%的股份。這將使他的股份在基於比較分析的情況下價值7100萬美元。如果DeepSeek達到與OpenAI相同的潛力,後者的估值約為1500億美元,那麼創始人可能會獲得鉅額收益。
有人質疑梁的DeepSeek是否如其所表現的那樣有前景。短板包括初創公司的基礎設施是否能夠處理全球流量,等待嘗試其服務,或者該應用程序對敏感話題的處理,例如1989年天安門廣場的抗議活動和關於中國領導人習近平的查詢。
專家們也質疑了DeepSeek正在使用10,000個A100 Nvidia芯片的假設,分析師如Dylan Patel推測DeepSeek需要至少50,000個Nvidia更強大的H100芯片。例如,Meta Platforms Inc.運營着相當於600,000個Nvidia H100的設備。
儘管如此,Liang正在推動全球AI生態系統的重新思考和重新校準。顯而易見的是,“AI競賽不會通過創建最複雜的模型來獲勝;而是通過將AI嵌入商業系統中以產生實際的經濟價值來獲勝,”數據分析和人工智能平台Qlik的首席執行官Mike Capone説道。