中國官媒:大模型創新未必要依賴最先進硬件 | 聯合早報
zaobao
(北京綜合訊)中國人工智能(AI)企業深度求索(DeepSeek)的新模型引發關注後,中國官媒《經濟日報》發文指出,大模型創新不一定要依賴最先進的硬件,“瘦身”反而促進AI技術的創新和突破。
深度求索1月20日發佈的推理模型DeepSeek-R1,在測試表現、訓練成本和開源開放程度等多個基準測試中均超越美國OpenAI公司的最新模型o1,但成本僅為o1的三十分之一。
《經濟日報》星期天(1月26日)發佈評論指出,DeepSeek-R1的成功説明,大模型創新不一定要依賴最先進的硬件,而是可以通過聰明的工程設計和高效的訓練方法實現,“模型並非越大越好,而是越精越妙,大模型‘瘦身’促進了AI技術的創新和突破。”
但評論也提到,如何在保證模型性能的前提下實現最大程度“瘦身”,是當前需要解決的關鍵問題。“瘦身”後的模型如何在不同場景下保證適應性和穩定性,也需要進一步驗證和優化。
不少西方輿論對DeepSeek-R1給予正面評價。英國《金融時報》評論指,美國和其盟友通過出口管制限制中國獲取先進晶片,卻激發了中國的創新能力。
延伸閲讀
中國DeepSeek發佈廉價大模型 性能比肩美OpenAI最新模型 澎湃新聞引述清華大學計算機系長聘副教授劉知遠説法稱,DeepSeek出圈説明了中國的競爭優勢所在,即通過有限資源的極致高效利用,實現以少勝多。
劉知遠也提醒,需要警惕輿論從極度悲觀轉向極度樂觀,“在別人已經探索出的路上跟隨快跑還是相對容易的,接下來如何在迷霧中開拓新路,才是更大的挑戰。”