DeepSeek的Prover解題模型引發對下一代R2進展的猜測 | 南華早報

Xinmei Shen

2025-05-02

深度求索新升級的數學專用人工智能（AI）模型，點燃了公眾對這家中國初創公司即將推出的R2推理模型的期待。儘管中國各大科技公司近期紛紛發佈自家大語言模型加劇競爭，但R2的細節仍籠罩在神秘面紗中。週三，深度求索悄然開源了名為Prover-V2的新AI模型，該模型擁有6710億參數，是其專攻數學證明模型的升級版。基於V3基礎模型的這次漸進式更新，彰顯了深度求索在獲取英偉達最先進AI芯片受限的情況下，仍能開發強大而相對精簡模型的能力。此次發佈引發網絡關注，人們一直密切關注這家明星初創的動態，但這並非許多人期待中的代際跨越。

就在發佈前一天，阿里巴巴集團（本刊母公司）剛推出Qwen3系列AI模型，這家科技巨頭宣稱其多項指標超越深度求索R1推理模型。今年1月發佈的DeepSeek-R1曾以高效資源利用率震驚全球AI界，僅用極低訓練成本就達到OpenAI o1模型的性能表現。兩週前OpenAI發佈的o3和o4-mini被其稱為"迄今最智能、最強大的模型"。

深度求索尚未公佈R2的發佈時間表或詳細信息。然而，這家總部位於杭州的公司推出的新型Prover模型已獲得人工智能和數學界的高度讚譽。一位X平台用户自稱"作為一名數學奧賽學生感到震撼"。