DeepSeek的Prover解題模型引發對下一代R2進展的猜測 | 南華早報
Xinmei Shen
深度求索新升級的數學專用人工智能(AI)模型,點燃了公眾對這家中國初創公司即將推出的R2推理模型的期待。儘管中國各大科技公司近期紛紛發佈自家大語言模型加劇競爭,但R2的細節仍籠罩在神秘面紗中。週三,深度求索悄然開源了名為Prover-V2的新AI模型,該模型擁有6710億參數,是其專攻數學證明模型的升級版。基於V3基礎模型的這次漸進式更新,彰顯了深度求索在獲取英偉達最先進AI芯片受限的情況下,仍能開發強大而相對精簡模型的能力。此次發佈引發網絡關注,人們一直密切關注這家明星初創的動態,但這並非許多人期待中的代際跨越。
就在發佈前一天,阿里巴巴集團(本刊母公司)剛推出Qwen3系列AI模型,這家科技巨頭宣稱其多項指標超越深度求索R1推理模型。今年1月發佈的DeepSeek-R1曾以高效資源利用率震驚全球AI界,僅用極低訓練成本就達到OpenAI o1模型的性能表現。兩週前OpenAI發佈的o3和o4-mini被其稱為"迄今最智能、最強大的模型"。
深度求索尚未公佈R2的發佈時間表或詳細信息。然而,這家總部位於杭州的公司推出的新型Prover模型已獲得人工智能和數學界的高度讚譽。一位X平台用户自稱"作為一名數學奧賽學生感到震撼"。