ChatGPT的神秘競爭對手DeepSeek創始人是誰?:播客 - 彭博社
K Oanh Ha, Yang Yang, Naomi Ng
深度求索創始人梁文峯
攝影師:VCG/Getty Images
精彩內容不容錯過。立即訂閲《亞洲大趨勢》播客。
## 亞洲大趨勢
中國AI革命的締造者
18:32
儘管中國的深度求索在全球引發熱議,但鮮有人瞭解其背後的男人——梁文峯。
在本期《亞洲大趨勢》播客中,主持人K. Oanh Ha與彭博社的Saritha Rai對話,探討這位帶領深度求索站上AI技術前沿的科技創始人,以及該公司的崛起如何揭示AI霸主之爭。
延伸收聽:深度求索為何導致英偉達等科技股暴跌
原創視頻:中國深度求索如何挑戰AI巨頭
立即通過蘋果播客、Spotify或您獲取播客的平台訂閲《亞洲大趨勢》。
*終端用户:點擊此處訂閲。*以下為經過簡編輯的對話實錄:
K. Oanh Ha: 今年早些時候,中國AI初創公司深度求索推出的新產品震驚全球,撼動了華爾街。
Tom Mackenzie: 中國的深度求索正在讓AI界為之瘋狂。隨着其應用登頂下載榜,科技股應聲下跌。
Ha: 但儘管引發全球關注,外界對深度求索背後的男人——中國企業家梁文峯知之甚少。
Saritha Rai: 梁文峯確實是個神秘人物。
Ha: 彭博社的Saritha Rai負責亞洲人工智能領域報道。
Rai: 他絕對是我見過最難以接近且最低調的科技企業家之一。為説明其低調程度——我們搜遍其官網都找不到任何照片,直到他在某次與習近平主席的高調會面中亮相,那張照片才讓世人得以窺見其真容。
Ha: 這位神秘人物長什麼樣?
Rai: 身材清瘦,戴眼鏡,但話不多
Ha: 娃娃臉?
Rai: 是的,可以這麼形容。
Ha: 深度求索以隱私為由鮮少回應關於梁文峯的問題。但Saritha和同事們對這個用AI系統顛覆科技界的男人充滿好奇,於是他們採訪了數十位知情人士:從前員工、同行研究員到投資人和業內知情者。
**Rai:**我們發現他確實極其低調、非常害羞,但同時也異常執着、才華橫溢且充滿激情。我認為他將深度求索視為一種使命,致力於讓中國在人工智能領域佔據一席之地,確保中國成為AI領域不可忽視的力量。
**Ha:**歡迎收聽彭博新聞社《亞洲大動向》節目,我是Oanh Ha。每週我們將帶您深入全球最大最具活力的經濟體,解析推動這個瞬息萬變地區的市場、商業巨頭與企業動態。 今天節目的焦點是:梁文峯是誰?我們將揭秘這位帶領深度求索站上AI前沿的神秘科技創始人。此外,這家公司的快速崛起對中美人工智能競賽意味着什麼?
**Ha:**Saritha,感謝參與節目。我對AI非常着迷,你們這期報道做得太精彩了。我們能否先從梁文峯的背景談起?關於他的出身我們瞭解多少?
**Rai:**梁文峯現年40歲左右,出生於廣東省一個名為米粒嶺的小村莊。父母都是小學教師。他天資聰穎,先後在浙江大學完成本科及碩士學業。
Ha: 在浙大期間,梁文峯與同學們醉心於各類技術領域:機器學習、信號處理、電子工程。他們甚至在金融危機期間開發過股票交易程序。畢業後,梁與兩位同窗聯手創立了名為高飛管理的量化對沖基金。
Rai: 量化基金本質上是通過數學模型和統計分析進行股票交易,決策過程無需人工干預。巔峯時期,高飛管理公司管理的資產規模高達140億美元,堪稱大型基金。在其最成功的運營階段,該基金為投資者提供的年化回報率平均達到35%。可以説,它確實表現非常出色。
**Ha:**據前員工透露,高飛公司有着極客風格的初創企業文化。早期招聘啓事自豪地宣稱吸引了來自谷歌和臉書的頂尖人才,並表示正在尋找具有"古怪才華"的數學與編程"極客"。
**Rai:**早期招聘中還提到了謝爾頓——美國著名情景喜劇《生活大爆炸》中那個極度社恐的主角
謝爾頓·庫珀: 比如我哭是因為別人太蠢,這讓我難過。
Rai: 謝爾頓擁有大批粉絲,其無意間展現的幽默令人捧腹。可以説,DeepSeek早期的整個企業文化都在試圖復刻這種極客文化。那裏有免費零食、撲克遊戲之夜,所有人都穿着T恤和拖鞋上班。
**Ha:**聽起來是個很棒的工作環境
**Rai:**是的,那確實是一種非傳統的初創企業文化。與中國阿里巴巴、騰訊等科技公司的氛圍截然不同。
**哈:**梁是如何從量化金融領域轉型到人工智能並創立深度求索的?
**雷:**梁一直對機器學習和人工智能抱有非凡的熱情。在OpenAI推出ChatGPT這個一夜之間風靡的聊天機器人後幾個月——那是2023年春天,ChatGPT發佈已過去數月——梁隨即成立了深度求索。在其早期宣言中,深度求索提出要拒絕平庸,攻克人工智能領域的重大挑戰,並最終實現通用人工智能的突破。
**哈:**宣言還闡明瞭深度求索的雄心——讓中國成為尖端技術的引領者。
**雷:**梁極少接受採訪,但已知的兩次訪談中,他都談到要將中國人工智能生態推向世界前沿。中國常被指責為模仿者,而他希望打造一個走不同道路的AI中國。
**哈:**深度求索進展神速。自2023年起,它發佈了超過六款AI模型,並率先應用了稀疏化技術——使模型訓練和運行更高效。開發者開始關注這家公司。接着在今年早些時候——
***大衞·古拉:***現在回到頭條新聞,深度求索震撼全球科技界…
**雷:**當他們發佈推理模型R1時,引發了行業巨震,導致股市萬億美元市值蒸發。世界這才真正開始關注這位神秘的中國AI創業者。
**哈:**那麼薩里塔,深度求索的R1模型究竟有何突破性意義?
**雷:**直到最近,AI行業始終圍繞着數十億美元的基礎設施投入——建設數據中心、配置用於訓練模型的圖形處理器。但深度求索證明了,其模型在某些基準測試中能媲美甚至超越OpenAI或Anthropic的最新模型,卻僅需極少的算力資源。據該公司宣稱,資金消耗也遠低於行業巨頭。
**哈:**梁博士團隊如何實現這種低成本的真創新?深度求索的成功對中美AI競賽意味着什麼?廣告之後為您揭曉。
**哈:**過去十年間,美國持續限制中國獲取半導體技術。2022年及次年,隨着華盛頓對北京實施兩輪芯片出口管制,緊張局勢達到頂峯。
***喬恩·埃利希曼:***英偉達等半導體企業股價今日暴跌,此前拜登政府宣佈將加強對華AI芯片出口限制。據英偉達向彭博社透露…
**哈:**這限制了英偉達等美企的銷售,其尖端芯片本是科技公司訓練AI模型的關鍵工具。雖然給開發者帶來巨大挑戰,但正如彭博社薩里塔·雷所言,這也倒逼中國科技企業另闢蹊徑。
Rai: 需求永遠是創新之母。中國AI團隊已證明了這一點——儘管面臨出口管制,他們依然開發出能與全球頂尖水平比肩的優秀模型。
Ha: 而深度求索最創新的突破之一,正是我們先前提到的稀疏化技術。
Rai: 稀疏化的核心在於無需高端算力即可構建模型。當大語言模型不必整體運作來響應查詢時,梁博士團隊嘗試將模型能力拆解為多個專家小組,僅調用所需模塊。這種方式大幅提升了計算效率和成本效益。
Ha: 這就像人腦運作原理——不需要動用整個大腦,只需激活特定腦區進行處理?
Rai: 完全正確。就像不必激活所有腦細胞,只需調動存儲特定專業知識的神經元集羣,就能應對編程指令或解答問題。
Ha: 這項突破令同行矚目,但真正引發轟動的還是成本優勢。深度求索透露其V3模型訓練僅耗資560萬美元,遠低於OpenAI開發最先進ChatGPT版本預估的1億美元投入。
Rai: 目前這個數字確實引發了大量質疑,因為僅基礎設施、模型訓練、人才投入和時間成本加起來就是一筆鉅額開支。因此這種懷疑不無道理。業內人士估算,深度求索公司若想實現這一目標,至少需要10億美元甚至更多資金支持。
Ha: 深度求索的優勢還在於,中國政府與習近平主席始終堅定支持這類AI初創企業。Saritha指出,習主席將生成式AI、機器人等高科技領域視為國家戰略的重要組成,是實現關鍵技術自主可控的關鍵一環。深度求索的成功也促使阿里巴巴、騰訊、字節跳動等巨頭紛紛推出自研AI模型。
Ha: Saritha,深度求索當前已完全開源其模型,這意味着任何個人或企業都能將其算法整合到自有程序中。該公司為何選擇這種策略?其重要性何在?
Rai: 從某種層面看,開源可視為AI技術的民主化進程,使其在全球範圍普及。但必須注意的是,若中國AI模型採用閉源模式且定價與OpenAI等西方公司相當,其國際接受度將大打折扣。通過低價策略,中國讓全球用户能快速接觸並使用這些模型,使其在商業和AI生態中迅速普及,從而實現對OpenAI等企業的彎道超車。這不僅是技術民主化,更是通過極致性價比讓產品快速成為全球主流,從戰略層面扼殺競爭對手生存空間的精明之舉。
**哈:**因此,微軟和亞馬遜都在其雲服務中提供了DeepSeek。DeepSeek的模型已被整合到Perplexity中,這是一個由AI驅動的搜索引擎,同時也提供來自OpenAI和Anthropic的模型。
**雷:**確實存在一個問題,即AI的發展速度有多快,全世界都擔心所有控制權僅掌握在一兩家公司手中。我認為這正是DeepSeek和其他公司試圖向世界傳達的信息,即所有控制權不能僅由一兩家公司及其構建的專有模型掌握,應該更加民主。因此,我認為開源哲學的核心在於降低風險、分散權力,並讓更多人能夠使用更易獲取的技術進行開發。
**哈:**在構建AI時,西方的方法與中國的方法之間是否也可能存在文化或價值觀的衝突?
**雷:**非常明顯,因為如果你看看DeepSeek的早期模型,甚至是未經調整或微調的模型,它們很大程度上是在中國的審查規則範圍內運作的。例如,你不能問它關於台灣或習近平的問題,否則它只會給出非常平淡的官方答案。然而,如果你使用相同的模型,並用其他數據訓練它,使其在文化上適應不同的地區,這正是DeepSeek早期學到的一點:通過開源模型,讓開發者和用户有機會根據自己的文化背景進行定製,DeepSeek可以在全球範圍內更快地獲得採用,而不是通過嚴格控制,使其只能在全球範圍內給出對中國友好的答案。
**哈:**儘管有人稱讚中國在人工智能領域的創新,但許多人對這種成功抱有更陰暗的懷疑。美國眾議院委員會4月的一份報告聲稱深度求索與中國政府存在"重大"關聯,並斷言該公司非法竊取了OpenAI的數據。中國駐美使館駁斥這些指控毫無根據。而深度求索和梁家恩均未就國會報告置評。
**哈:**薩里塔,當前中美之間的人工智能競爭看起來確實像某種軍備競賽。
**萊:**這確實是場競賽,但現在判定贏家為時過早。一年前我絕不會認為這是場勢均力敵的較量。這是場馬拉松,卻需要短跑的速度。我們剛站在起跑線上,對任何贏得競賽的國家來説,潛在經濟收益都不可估量。因此各國尤其是中美都不願在AI領域鬆懈。
**哈:**你認為深度求索目前面臨哪些挑戰?
**萊:**關鍵挑戰在於下一步行動——如何超越已有成就。同時在國內市場,阿里巴巴、字節跳動、騰訊等企業開發的模型已超越深度求索的上代旗艦產品,這種競爭壓力迫使他們必須做得更好。此外還存在商業模式問題:這類企業如何盈利?深度求索是否以盈利為目標?若想盈利又將通過何種途徑?目前都沒有明確答案。
本期節目由楊洋、娜奧米·黃製作,羅希特·帕塔克協助;奧斯汀·卡爾、黃哲平提供補充報道;高級製作人:娜奧米·沙文;編輯:帕迪·赫希、約書亞·布魯斯坦;高級編輯:伊麗莎白·龐索特;副執行製作人:朱莉婭·韋弗,執行製作人:妮可·比姆斯特伯;音效設計/工程師:安田隆;事實核查員:娜奧米·黃。