中國官媒：大模型創新未必要依賴最先進硬件 | 聯合早報

zaobao

2025-01-27

（北京綜合訊）中國人工智能（AI）企業深度求索（DeepSeek）的新模型引發關注後，中國官媒《經濟日報》發文指出，大模型創新不一定要依賴最先進的硬件，“瘦身”反而促進AI技術的創新和突破。

深度求索1月20日發佈的推理模型DeepSeek-R1，在測試表現、訓練成本和開源開放程度等多個基準測試中均超越美國OpenAI公司的最新模型o1，但成本僅為o1的三十分之一。

《經濟日報》星期天（1月26日）發佈評論指出，DeepSeek-R1的成功説明，大模型創新不一定要依賴最先進的硬件，而是可以通過聰明的工程設計和高效的訓練方法實現，“模型並非越大越好，而是越精越妙，大模型‘瘦身’促進了AI技術的創新和突破。”

但評論也提到，如何在保證模型性能的前提下實現最大程度“瘦身”，是當前需要解決的關鍵問題。“瘦身”後的模型如何在不同場景下保證適應性和穩定性，也需要進一步驗證和優化。

不少西方輿論對DeepSeek-R1給予正面評價。英國《金融時報》評論指，美國和其盟友通過出口管制限制中國獲取先進晶片，卻激發了中國的創新能力。

延伸閲讀

中國DeepSeek發佈廉價大模型性能比肩美OpenAI最新模型澎湃新聞引述清華大學計算機系長聘副教授劉知遠説法稱，DeepSeek出圈説明了中國的競爭優勢所在，即通過有限資源的極致高效利用，實現以少勝多。

劉知遠也提醒，需要警惕輿論從極度悲觀轉向極度樂觀，“在別人已經探索出的路上跟隨快跑還是相對容易的，接下來如何在迷霧中開拓新路，才是更大的挑戰。”