梁文峯簡傳:小鎮青年攜DeepSeek叩開全球富豪榜大門_風聞
大道财经-昨天 19:37

作者 雨霏
編輯 莊澤
2025年春節前後,DeepSeek在AI界掀起了驚濤駭浪。這一AI大模型的卓越表現,不僅讓中國科技界為之振奮,更促使世界重新審視中國在人工智能領域的實力。全球資本市場也因此重新評估中國科技股的價值,春節後A、H 股市場的科技股持續走強。
在中國的AI浪潮中,DeepSeek創始人梁文峯無疑是最為耀眼的明星之一。這位曾經的華爾街精英,僅用短短三年時間,就將 DeepSeek打造成了全球AI領域的領軍企業。他的故事,不僅是一個技術創新的傳奇,更是中國科技崛起的生動縮影。
個人奮鬥與時代機遇的完美結合
1985年,梁文峯出生於廣東湛江一個小鎮,這是一個普通家庭,父親是小學教師,一生專注教育事業,秉持獨特的教育理念,從不只關注梁文峯的分數,而是詢問他當天解決了什麼問題。母親從事普通工作,雖然家庭經濟條件一般,但為梁文峯營造了良好的教育環境。自幼,梁文峯就展現出卓越的數學天賦,初中時便自學完成高中數學課程,還主動涉獵大學數學內容。
2002 年,年僅17歲的梁文峯以高考狀元的身份考入浙江大學電子信息工程專業,得以接觸到廣闊的學術資源,拓寬了視野。隨後,他一路攻讀完信息與通信工程碩士學位。
在浙江大學求學期間,2008 年全球金融危機爆發,梁文峯敏鋭地察覺到機器學習技術在全自動量化交易中的應用潛力,帶領團隊深入探索。這次探索成為他職業生涯的重要起點。2015 年,他與兩位浙江大學校友共同創立了量化對沖基金 High - Flyer。在量化投資領域,梁文峯憑藉紮實的數學功底和人工智能技術,讓基金迅速嶄露頭角,收穫了豐厚的利潤。這段經歷不僅讓他在金融領域積累了豐富的經驗和財富,也加深了他對人工智能技術應用的理解,為他日後在AI領域的發展奠定了堅實基礎。
創立DeepSeek開啓 AI新徵程
在量化投資領域取得成功後,梁文峯對人工智能的熱愛促使他做出了一個重大決定——進軍人工智能領域。2023年7月,他成立了DeepSeek,正式開啓AI新徵程。
梁文峯的創業靈感源於他早年對機器學習技術在量化交易中潛力的敏鋭捕捉,以及在杭州幻方科技有限公司的深入鑽研。在幻方科技,他通過AI和算法分析影響股價的模式,發現了人工智能領域廣闊天地。他預見到人工智能將對社會產生巨大的變革,希望通過自己的努力,讓人工智能為人們的生活帶來更多積極改變,提升社會整體的智能化水平。
梁文峯憑藉敏鋭的洞察力,精準識別了人工智能行業的核心痛點。他意識到,大模型訓練效率的提升和數據更新的準確性是行業發展的關鍵。未來,大模型的訓練將從按年更新轉變為按月甚至按周更新,以提高數據處理的時效性和準確性。同時,人工智能的發展將從技術驅動轉變為產品與銷售雙輪驅動,企業必須更加關注市場需求,打造符合用户需求的產品。在硬件兼容性方面,大模型在硬件上的適配能力對於滿足即時性和高效性的應用需求至關重要。此外,他還預見到人工智能將在語音、圖片和視頻等領域實現優先突破,推動相關領域的快速發展。
創業初期,梁文峯面臨着諸多挑戰。美國對先進AI芯片的出口限制,給DeepSeek 的技術研發帶來了巨大阻礙。但梁文峯帶領團隊通過優化技術,在受限的NVIDIA H800 GPU 上開發出性能優於OpenAI的GPT-4 和Meta 的 Llama 3.1 等模型的 DeepSeek V3,展現了公司在硬件效率和模型架構上的創新能力。這一進步不僅縮小了與全球領先企業的差距,還在一定程度上促進了中國人工智能生態系統中硬件效率和替代解決方案的發展。
面對行業競爭對手的關注,以及數據安全和政府監管帶來的擔憂,梁文峯採取了一系列應對措施。在大模型算法和GPU算力利用率上,DeepSeek做了出色的工程優化,引發了大模型行業的激烈價格戰。梁文峯表示,DeepSeek從未想過要成為顛覆者,定價僅在成本之上保留了一定的利潤空間,目的是讓AI和API服務成為人人都能負擔得起、隨時可用。這一策略不僅降低了成本,也使DeepSeek 在競爭中佔據了優勢。
DeepSeek的發展與成就
2023年7月DeepSeek成立後,梁文峯在團隊組建上獨樹一幟。他沒有依賴海歸或高級技術專家,而是組建了一支由本土年輕程序員組成的團隊,成員多為應屆畢業生或工作經驗不超過5年的年輕人。梁文峯認為,創新需要擺脱慣性,經驗有時會成為包袱。他在接受媒體採訪時表示,DeepSeek的核心技術崗位主要由最近一兩年畢業的人員擔任。此外,DeepSeek的團隊組成與硅谷諸多AI巨頭大相徑庭,梁文峯在組建研究團隊時,專注於來自北大、清華等頂級高校的博士生。這些博士生許多人曾在頂級學術期刊發表論文,並在國際學術會議上獲獎,但缺乏行業經驗。這種團隊構成不僅降低了訓練成本,還為公司注入了新鮮的血液和創新思維。
在成立初期,梁文峯沒有急於尋求外部資本,而是通過自己在量化交易領域積累的財富,為DeepSeek的技術研發提供了堅實的資金基礎。這種自給自足的創業理念,使得DeepSeek能夠在沒有過早商業化壓力的情況下,專注於技術創新和突破。之後,他有選擇性地與那些能夠為公司帶來長期價值的投資者合作,獲得了必要的資源支持,為公司的長遠發展奠定了堅實的基礎。
2024年12月,DeepSeek V3的發佈成為公司發展的重要里程碑,其性能與海外領軍閉源模型相匹敵。這一成就不僅復現了OpenAI o1的強化學習效果,還在有限算力下實現了算法創新,捅破了強化學習用於大模型推理的窗户紙,成為繼 OpenAI之後推理領域的第二個里程碑。DeepSeek公開的數據顯示,V3預訓練成本僅為557.6萬美金,使用1萬張H800僅需11天就能完成訓練,這一成本相對國際上領先模型大幅降低,對於我國突破算力限制具有重要意義。
當下,DeepSeek在金融和汽車行業也取得了重大突破。長江計算聯合昇騰、華為雲團隊,使用 G440K V2 服務器,已為某國有大型銀行成功部署DeepSeek V3 模型的本地化推理服務,使銀行能夠在內部安全環境下快速處理海量金融數據。此外,吉利和廣汽也相繼傳來消息,吉利汽車集團CEO淦家閲宣佈將於今年3月初對外發布重磅AI智能化戰略,吉利將成為智能汽車AI科技的引領者。廣汽智能車機藉助 DeepSeek R1大模型回答語音提問的表現,標誌着廣汽自主研發的ADiGO SENSE端雲一體大模型與DeepSeek R1大模型完成深度融合。新華保險在新華e家 App 成功接入DeepSeek R1和 DeepSeek V3兩款模型產品,打造個人AI助理,支持多個智能應用場景。百融雲 - W (06608) 完成與 DeepSeek 的全面接入,並在企業級智能體平台 CybotStar AgentBuilder 中實現應用。
DeepSeek 成功進入國際市場,已然成為中國 AI 出海的一張 “名片”。在沙特阿拉伯的利雅得 LEAP 2025 科技大會活動中,宣佈 DeepSeek 在沙特達曼的阿美數字數據中心即將正式開始運營。目前 DeepSeek 已在 Apple App Store 上線了其官方應用,憑藉先進模型 DeepSeek V3,給全球許多國家地區的用户提供了新的智能體驗,被許多人視為 ChatGPT 等付費 AI 應用的免費版平替。
DeepSeek的核心技術與創新
在金融領域,梁文峯深入分析了人工智能如何通過算法和機器學習技術,提高金融分析的效率和準確性。人工智能系統能夠處理和分析大量數據,識別出複雜的模式和趨勢,通過深度學習算法,可以預測市場動態,為投資決策提供支持。此外,人工智能還能通過自然語言處理技術,分析新聞報道、社交媒體帖子等非結構化數據,以獲取市場情緒和潛在風險信號。這些技術的應用,不僅提高了分析的速度,還增強了分析的深度和廣度,為金融行業帶來了革命性的變化。
DeepSeek 在數據挖掘技術領域取得顯著成就,嘗試預測 2025 年春節後 PE(聚乙烯)和 PP(聚丙烯)期貨走勢的研報,展現了 AI 在數據分析和策略生成方面的潛力。報告從供應端、需求端、成本與利潤、價差與基差等多個維度進行了分析,並提出了具體的交易策略。推出的 DeepSeek V3 和 DeepSeek R1 兩款先進的 AI 語言模型,通過多頭潛在注意力(MLA)和專家混合等突破性技術,顯著減少了訓練模型所需的計算資源。
DeepSeek 專注於開發高性能、低成本的 AI 模型,致力於推動 AI 技術的普惠化。據獨立研究公司 Melius Research 整理的數據顯示,DeepSeek 的 AI 模型生成信息的成本大約是 OpenAI ChatGPT 的十分之一。DeepSeek 使用了一種只激活模型中最相關的部分來回答問題的計算類型,並且是開源的,這可以降低許可成本。此外,DeepSeek 對人才極其看重,不看經驗,只看能力,人才密度極高,且多來自於中國本土市場。這些差異化優勢使得 DeepSeek 在激烈的市場競爭中脱穎而出。
梁文峯預測,隨着大模型性能的提升和成本的降低,生成式 AI 將在金融行業實現規模化應用,特別是在銀行 IT、保險 IT 和證券 IT 領域。預計到 2030 年,生成式 AI 將為金融 IT 服務行業帶來 690 億元的增量收入,佔行業總收入的 24%。DeepSeek 引領 AI 浪潮,金融科技 ETF (516860) 漲超 2%,顯示出 DeepSeek 概念的活躍度和市場的認可度。博時基金率先部署 DeepSeek,以金融科技為業務賦能,全面提升金融科技能力,進行數智化、智能化轉型。
梁文峯的領導風格與管理理念
梁文峯強調對AI能力邊界的好奇,選人的標準始終是熱愛和好奇心,信任並賦予團隊成員充分的自由,以身作則塑造了DeepSeek自下而上的組織文化,不前置分工而是自然分工,極大地激發了團隊的創造力和自主性。他推崇“極客文化”,推行扁平化管理,鼓勵員工個人發揮潛能進行學習和創新,不採用“賽馬”機制,減少團隊內耗,對算力資源的調配上不設上限,只要員工提出有潛力的思路,都會給予足夠的資源進行嘗試研究。
梁文峯認為DeepSeek的長遠目標是推動技術邊界,而非僅僅追求短期盈利。公司選擇將技術成果開源,以吸引頂尖人才並促進技術交流。他強調真正的競爭優勢在於團隊的成長、技術的積累和創新文化的培育。面對美國對中國 AI 公司的限制,他帶領團隊在有限的本土芯片計算能力下進行創新,展現出卓越的領導力和前瞻性。
梁文峯身價或超黃仁勳躋身全球富豪榜
據業內專家估算,DeepSeek 的估值可能高達1500億美元,使得梁文峯的身家有望躋身全球富豪榜前列,甚至可能超越英偉達創始人黃仁勳。1月20日,梁文峯現身央視《新聞聯播》,以DeepSeek創始人的身份參加座談會併發言,進一步提升了DeepSeek的知名度和品牌形象。
在金融科技和人工智能領域,市場競爭日益激烈。隨着越來越多的企業進入該領域,梁文峯和DeepSeek需要不斷創新並保持差異化優勢,以應對競爭對手的挑戰,避免市場份額被侵蝕。
在國際市場拓展過程中,DeepSeek 需要遵守不同國家和地區的法律法規。金融科技行業監管趨嚴,若在合規方面出現問題,將面臨罰款、業務受限等風險,影響公司的聲譽和業務發展。
未來,儘管面臨諸多挑戰,但憑藉着創新的技術、獨特的團隊文化和前瞻性的戰略規劃,DeepSeek有望在全球 AI 舞台上繼續書寫輝煌篇章。(本文涉及資料全部來源Wind)