Deepseek引通用人工智能新熱潮,全棧國產深度推理大模型訊飛星火即將升級
guancha
春節期間,Deepseek引發的全球關注,推動國內通用人工智能迎來一個新的高潮。市場分析人士認為,DeepSeek熱潮主要得益於國產大模型技術的快速發展,以及美國對華算力管控趨嚴,在目前背景下,國產替代邏輯將持續強化。
值得注意的是,春節前夕,國內人工智能龍頭企業科大訊飛在其內部年會上宣佈,即將對其全國產算力深度推理大模型星火X1進行重大版本升級。此次升級將進一步提升星火X1在數學、教育、醫療、科研等關鍵領域的性能,確保其在這些領域始終保持業界領先水平。
大模型算力需求:訓練與推理的差異
大模型的研發和應用離不開強大的算力支持。大模型對算力的需求主要體現在兩個方面:訓練和推理。其中,訓練是指利用海量數據對模型進行學習,使其具備特定的能力;推理則是指利用訓練好的模型對新的數據進行處理和分析,從而完成特定任務。
科大訊飛相關人士表示,從技術難度來看,訓練實現的難度遠大於推理實現的難度。這是因為訓練過程需要處理的數據量更大,計算複雜度更高,對算力平台的穩定性和效率也提出了更高的要求。這也是為什麼目前包括華為在內的眾多國產GPU廠商和雲計算廠商宣佈可以在國產算力平台上提供推理服務,而只有訊飛星火一家大模型是訓練和推理均在國產算力上進行的原因。
2024年1月30日,科大訊飛推出了星火3.5,這是首個基於全國產算力訓練的大模型,也是迄今為止國內唯一一個。2025年1月15日,科大訊飛又推出了首個使用全國產算力訓練的深度推理模型星火X1,這標誌着國產算力訓練大模型又邁出了關鍵一步。據悉,星火X1僅使用了1萬張910B國產算力卡,就取得了大模型研發上的一系列成果。這背後離不開科大訊飛在國產算力平台上的大量無人區適配和效率優化工作。可以説,科大訊飛真正把國產算力做到了極致效率,是技術實力和戰略勇氣的體現,也為後續國產大模型做國產算力適配趟平了道路。
全棧國產化:戰略意義與先發優勢
據參考消息援引美媒報道,美國海軍基於“潛在安全和道德問題”,已要求人員避免以任何形式使用中國公司的DeepSeek模型。同時,硅谷數據標註公司Scale AI創始人Alexander Wang表示:美國政府為保持領先優勢,需要對DeepSeek的 AI 芯片進行調查和管制。
隨着DeepSeek引發的美國對華算力管控進一步趨嚴,科大訊飛所構建的大模型全棧國產化技術具有戰略意義和先發優勢。全棧國產化意味着從硬件到軟件,從訓練到推理,整個大模型產業鏈都實現了自主可控,這將有效降低我國人工智能產業發展對國外技術的依賴,保障國家人工智能戰略安全。隨着國產算力水平的不斷提升和應用場景的不斷拓展,相信未來會有更多國產大模型基於國產算力生態湧現出來,推動我國人工智能產業邁向新的高度。