馬雲支持的螞蟻集團利用國產芯片實現AI技術突破——彭博社
Lulu Yilun Chen
由馬雲支持的螞蟻集團採用國產芯片開發AI模型訓練技術,據知情人士透露,此舉可降低20%成本。
知情人士稱,螞蟻運用包括阿里巴巴集團和華為技術有限公司在內的國產芯片,通過"專家混合"機器學習方法訓練模型。其效果與英偉達H800芯片相當。因信息未公開,這些人士要求匿名。一位人士表示,螞蟻雖仍使用英偉達進行AI開發,但在最新模型中已轉向超威半導體及國產芯片替代方案。
此舉標誌着螞蟻加入中美企業競賽。自深度求索公司證明無需像OpenAI和谷歌投入數十億美元也能訓練優質模型後,該競賽持續升温。這凸顯中國企業正嘗試用本土方案替代最先進的英偉達芯片。H800雖非最尖端,卻是當前被美國禁運至中國的較強算力芯片。
該公司發表的研究論文稱,其模型在某些基準測試中偶爾超越Meta Platforms Inc.(該結果未經彭博新聞獨立核實)。若效果屬實,螞蟻平台通過降低AI推理和服務支持成本,或將推動中國人工智能發展再進一步。
隨着企業向人工智能領域投入大量資金,混合專家模型(MoE)已成為熱門選擇,谷歌和杭州初創公司深度求索等機構的應用使其廣受認可。該技術將任務分解為更小的數據集,就像組建一支專家團隊,每位成員專注於工作的某個環節,從而提升效率。螞蟻集團在郵件聲明中拒絕置評。
| 更多人工智能相關閲讀: |
|---|
| 英偉達CEO稱對深度求索影響的擔憂是杞人憂天 |
| 創始人稱斯坦福、哈佛畢業生爭相加入中國AI初創企業 |
| AI先驅預測美中行業洗牌後僅少數模型能存活 |
| 騰訊營收創多年最快增速後加速AI投入 |
然而,MoE模型的訓練通常依賴英偉達銷售的圖形處理器等高性能芯片。高昂成本至今仍令許多小型企業望而卻步,限制了更廣泛採用。螞蟻集團一直致力於提升大語言模型訓練效率以突破此限制。其論文標題明確表達了"無需高端GPU"擴展模型的目標。
這與英偉達的理念背道而馳。首席執行官黃仁勳認為,即便出現深度求索R1等高效模型,計算需求仍將增長,主張企業需要更強大的芯片來創收,而非更廉價的芯片來降本。他堅持通過增加處理核心、晶體管和內存容量來打造大型GPU的戰略。
彭博行業研究觀點
螞蟻集團的論文凸顯了中國人工智能領域創新力提升與技術發展加速的態勢。若其主張得到證實,則表明中國正通過採用成本更低、計算效率更高的模型來規避英偉達芯片出口管制,在AI自主化道路上取得顯著進展。
——彭博行業研究高級分析師Robert Lea
螞蟻集團表示,使用高性能硬件訓練1萬億token需花費約635萬元人民幣(88萬美元),而經優化的方案採用較低配置硬件可將成本降至510萬元。Token是模型理解世界並回應用户查詢時所處理的信息單元。
知情人士透露,該公司計劃利用其最新研發的大語言模型"靈Plus"和"靈Lite"的技術突破,為醫療健康及金融等領域提供工業級AI解決方案。
螞蟻集團於今年收購中國在線醫療平台好大夫在線,以強化其醫療健康領域的人工智能服務。該公司還擁有名為"知小寶"的AI生活助手應用及智能理財服務"螞小財"。
在英語理解能力方面,螞蟻集團論文指出,其"靈Lite"模型在關鍵基準測試中表現優於Meta的Llama系列某一模型。而"靈Lite"與"靈Plus"在中文基準測試中的表現均超越深度求索公司的同類模型。
| 瞭解更多關於中美人工智能競賽的信息 |
|---|
| 人工智能熱潮如何造就史上最具價值的壟斷企業人工智能公司青睞芯片需求更少的高效模型阿里巴巴領跑追趕中國深度求索的競爭對手 |
“如果你找到一個擊敗世界頂級功夫大師的突破點,你仍然可以説你擊敗了他們,這就是為什麼實際應用很重要,”北京人工智能解決方案提供商盛商科技首席技術官Robin Yu表示。
螞蟻集團已將靈模型開源。靈-Lite包含168億個參數,這些可調節設置如同旋鈕和刻度盤般控制模型性能。靈-Plus擁有2900億參數,在語言模型領域被認為規模較大。作為對比,專家估計ChatGPT的GPT-4.5模型具有1.8萬億參數,據《麻省理工科技評論》報道。深度求索R1模型擁有6710億參數。
螞蟻集團在訓練過程中面臨穩定性等挑戰。該公司在論文中表示,硬件或模型結構的微小變化都會導致問題,包括模型錯誤率飆升。