深度求索(DeepSeek)在震驚世界一個月後,仍專注於通用人工智能突破而非快速盈利 | 南華早報
Ben Jiang
中國人工智能(AI)初創企業深度求索(DeepSeek)在發佈震驚全球的推理模型後,據消息人士和媒體報道,過去一個月裏該公司始終將研究置於快速盈利之上。自R1推理模型登上硅谷和華爾街頭條以來,這家由梁文峯創立、脱胎於對沖基金業務的杭州初創企業一直保持低調,除開發者社區外極少與公眾溝通。
這位40歲的創始人過去一個月未發表任何公開言論或接受媒體採訪。儘管上週中國官方電視台短暫播出了他出席習近平總書記主持的高規格座談會的畫面,但官方媒體發佈的會議通稿中未引用他的任何發言。梁文峯近期唯一公開露面的身份是與另外14人合著的論文《原生稀疏注意力:硬件對齊且可原生訓練的稀疏注意力》的共同作者。該論文15位作者中至少有12人曾參與R1模型論文工作,表明梁文峯與深度求索的年輕科學家們直接參與了這項研究。
深度求索創始人梁文峯與習近平會面。圖片來源:央視新聞
一位不願透露姓名的公司內部消息人士表示,深度求索並不急於進行更多融資或開展新的商業活動。相反,梁先生正致力於通過以最小資源提升模型效率和能力,來推動通用人工智能(AGI)的發展。AGI指的是一種達到或超越人類認知能力的人工智能。
關於深度求索的關鍵優先事項,該人士表示:“這是否是一個明智的選擇,以及它能持續這項研究多久,只有時間能給出答案。一個核心問題是規模法則依然存在,僅靠算法改進很難保持領先優勢。”