天才在投資基金危機中創造了DeepSeek - 彭博社
bloomberg
DeepSeek 應用程序照片:彭博社三年前,量化對沖基金 quant,即量化基金,的梁文峯向投資者道歉,因為在中國股市動盪的時期虧損。
這對浙江高飛資產管理公司來説是一個意外的失誤,該公司利用人工智能選擇股票,並迅速成為國內最大的 quant 基金之一。在公司經歷危機、資產從超過120億美元的高峯減少超過三分之一的同時,梁在幕後為一家新的人工智能公司 DeepSeek奠定基礎。
DeepSeek 現在威脅要顛覆全球人工智能供應鏈,並挑戰美國在尖端技術方面的領導地位。這項技術在創立20個月後突然流行,導致週一美國和歐洲的股市暴跌,近一萬億美元的市場價值被摧毀,涉及芯片巨頭英偉達公司及其他類似公司。
這也讓人驚訝的是,梁作為一名工程學畢業生,從未在中國大陸以外學習或工作,竟能取得如此成就。他證明了在擁有本地人工智能工程師、受限於最新半導體技術和有限資源的情況下,有可能與該領域的頂尖公司相匹敵,甚至超越他們。
“世界上所有國家都可以啓動這樣的項目,只要他們能夠獲得人才並能夠在此基礎上工作。其他行業將從中學習,”來自舊金山的人工智能初創公司Reken的聯合創始人兼首席執行官Shuman Ghosemajumder説道。
現在投資者、企業和政策制定者想知道,開發最新的創新和前沿人工智能模型是否真的需要數千億美元,以及出口管制是否能夠遏制中國的競爭。
現在,梁被拿來與OpenAI的創始人薩姆·阿爾特曼進行比較,但這位中國公民保持着更低的個人形象,鮮少在公眾場合發言。“OpenAI不是神,也不總能處於前沿,”梁在2024年7月對中國媒體36Kr説道。
前一年,梁表示,更多的投資並不一定會導致更多的創新。他還評論了中國企業長期以來大多是追隨者而非技術創新者的問題。根據他的説法,問題在於“缺乏信心以及不知道如何組織人才密度以實現有效的創新”。
DeepSeek應用程序。攝影師:Lam Yik/Bloomberg### 一個特例
梁於1985年出生在中國南方廣東省相對貧窮的城市湛江。他的父親是一名小學教師。他在著名的浙江大學學習電子工程,並在杭州獲得了信息與通信工程的碩士學位。
High-Flyer在中國投資基金行業中是一個特例,就像DeepSeek在全球人工智能行業中一樣。
梁和他的兩位大學同學在2008年開始投資當地股票。與大多數中國量化基金的創始人不同,他們都沒有海外或大型金融公司的經驗。
這三人嘗試了不同的策略,從自由交易到套利,直到2015年決定採用系統化的方法來實施交易理念,那一年他們創建了High-Flyer。最初,他們創建了一個基於價格和成交量的模型,然後在2016年嘗試 機器學習。
這項新工具使公司能夠深入尋找新的因素,並識別它們之間的“非線性”連接,首席執行官Simon Lu在2020年的一次採訪中表示。創始人在2018年將機器學習整合到High-Flyer的產品中。
人工智能使High-Flyer實現了“許多創新”,並開發了一個多策略和多週期的投資模型,以“積累”來自不同收益來源的回報,根據該公司的2020年宣傳冊。他們的明星產品使用CSI 500指數作為 基準,並整合了低風險策略,如日內交易,使其在過去三年中總共超過該指標120個百分點。
High-Flyer迅速增加了其資產,因此在2021年達到了超過90000億元人民幣,但在同年稍晚時遇到了困難。
觀看:華爾街在本週初面臨困難,因為人們擔心中國的一種更便宜的人工智能模型可能威脅到美國的技術主導地位。(視頻為英語)。
在2021年12月,經歷了一些基金的創紀錄淨流出後,High-Flyer表示其人工智能在尋找某些交易的適當時機時出現了錯誤,並在股市大幅波動期間表現不佳。“我們感到非常內疚,”它對投資者説。該公司停止接受新投資,並表示將減少其管理資產並調整其策略。
三個月後,其市場總監警告某些對波動敏感的客户必須撤回他們的資金,這是一項非常不尋常的措施。
去年,High-Flyer表示將減少在市場上進行雙向押注的產品,並專注於“僅多頭”策略,即只在股票上採取看漲頭寸。其管理資產已降至約60000億元人民幣。
資助研發
DeepSeek的研究是由High-Flyer的研發預算資助的,梁之前表示。它從量化基金獲得了計算資源,該基金在2021年積累了10000個Nvidia GPU,在美國禁止出口更先進的芯片和其他圖形處理單元之前。
梁幾乎完全從中國招募工程師。許多人剛剛從頂尖大學畢業,是他們博士學習階段的實習生和奧林匹克獎牌獲得者。
“他是個書呆子,但在這個背景下,書呆子並不是負面的,”西北大學的博士生王子涵説,他在2024年在DeepSeek進行了六個月的實習。
王説,梁自己進行了很多實驗,DeepSeek的運作方式與研究實驗室非常相似。“起初很小,但隨着他們取得真正的進展,他們開始感到興奮,”他説。
這家 初創公司 開始定期發佈模型,顯然對美國禁止出口最先進的AI加速芯片免疫。
DeepSeek於1月20日發佈了其先進的AI推理模型R1,正是唐納德·特朗普宣誓就任美國第47任總統的同一天。
在那個星期一早些時候,梁參加了在北京舉行的由中國總理李強組織的閉門商業研討會。根據新華社的報道,來自技術、科學、教育和其他領域的專家在會上提供了對政府工作報告草案的意見和建議。YouTube上的視頻顯示梁坐在李面前交談,李領導認真地點頭。
值得注意的是,DeepSeek將R1做成了開源,這使得研究人員和開發者可以自由使用、修改和商業化該模型。這表明它希望與全球AI社區的其他人合作和創新。
梁在中國企業家中因其非商業目標而脱穎而出,他專注於研究和實現通用人工智能,塔夫茨大學技術政策助理教授托馬斯·啓通·曹説道。
梁將擁有High-Flyer的51%股份。這將使他的股份估值達到7100萬美元,根據彭博億萬富翁指數。如果DeepSeek達到與OpenAI相同的潛力,估值約為15000億美元,創始人的財富將會大幅增長。
一些人質疑梁的DeepSeek是否如看起來那麼有前景。它在管理全球巨大需求和等待試用其服務的流量方面顯示出問題,並且在中國一些敏感話題上沒有提供信息,例如1989年天安門廣場的抗議活動或關於中國領導人習近平的諮詢。
專家們也質疑DeepSeek僅使用10000個Nvidia A100芯片的假設。分析師如迪倫·帕特爾推測,DeepSeek至少需要50000個Nvidia H100芯片,這些芯片要強大得多。例如,Meta Platforms Inc運營着相當於600000個Nvidia H100芯片的設備。
儘管如此,梁正在推動全球人工智能生態系統的重新校準。顯然,“人工智能的競賽不會通過創建最複雜的模型來贏得,而是通過將人工智能整合到商業系統中以產生有形的經濟價值,”數據分析和人工智能平台Qlik的首席執行官邁克·卡彭説道。
原始備註:中國量化天才在基金崩盤的陰影下建立了DeepSeek