深度求索創始人在最新技術研究中透露公司AI發展重點 | 南華早報
Zhou Xin
深度求索在一項新技術研究中明確了其下一階段發展重點。這項由創始人兼首席執行官梁文峯等15位合著者參與的研究聚焦"原生稀疏注意力"(NSA)系統,該系統被宣稱能顯著提升人工智能(AI)模型處理海量數據的效率。這項《原生稀疏注意力:硬件對齊且可原生訓練的稀疏注意力》研究論文於週日通過科研社區專業平台arXiv發佈。就在論文發表前一天,40歲的梁文峯剛在北京參加了由國家主席習近平主持的科技企業家座談會。據不願具名的知情人士透露,隨着這家杭州初創企業獲得全球矚目,深度求索正全力聚焦科研領域,目前並不急於開展融資或新的商業活動。研究表明,在成功開發突破性開源AI模型後,梁文峯與深度求索的年輕科學家團隊正持續推動行業技術邊界。這家初創公司的突破性進展…V3和R1,僅需科技巨頭開發大語言模型(LLM)項目通常所需成本和算力的零頭。研究指出:“通過對現代[計算]硬件的優化設計,NSA在保持性能的同時加速了推理過程並降低了預訓練成本。”
推理是指經過訓練的AI模型在從未見過的數據中識別出其在訓練數據集中學習到的模式。這使得AI模型能夠進行類似人類能力的推理和預測。
深度求索創始人兼CEO梁文鋒(左二)週一在北京舉行的座談會上與習近平主席交流問候。圖片來源:央視新聞