《南華早報》:深度求索悄然更新開源模型,可處理數學證明
Ben Jiang
中國初創企業深度求索(DeepSeek)於週三悄然開源了一款新的專業人工智能(AI)模型,就在阿里巴巴發佈其通義千問家族第三代產品的次日。隨着生成式AI能力競賽的白熱化,這場角逐正持續升温。總部位於杭州的深度求索將最新開源模型Prover-V2上傳至全球最大AI開源社區Hugging Face,但未在其官方社交媒體渠道發佈任何公告。此舉正值業界對其即將推出的R2推理模型充滿期待之際。
深度求索的Prover系列是專為解決數學相關問題設計的垂直領域模型。
該公司尚未在Hugging Face頁面提供該模型的具體細節。南華早報查看的上傳文件顯示,該模型基於擁有6710億參數的DeepSeek V3模型構建,採用專家混合架構以實現高性價比的訓練與運行。
這款專注於數學能力的模型有望增強通用基礎模型的數學技能,這引發了業界對深度求索即將推出更多新模型的猜測。
截至週三發稿,深度求索尚未就置評請求作出回應。