Meta即將在本月推出其新的人工智能模型Llama 4:信息 | 路透社
Reuters
4 abr (路透社) - Meta Platforms (META.O)計劃在本月底發佈其大型語言模型的最新版本,此前已至少推遲了兩次,週五《信息》報道,Facebook的擁有者正在努力在人工智能競賽中保持領先。然而,根據報告,Meta可能會再次推遲Llama 4的發佈,該報告引用了兩位熟悉此事的人士。
大型科技公司在OpenAI的ChatGPT成功後,正在積極投資人工智能基礎設施,這一成功改變了科技格局,並推動了機器學習的投資。
根據報告,推遲的原因之一是,在開發過程中,Llama 4在技術測試方面未能達到Meta的預期,尤其是在推理和數學任務上。
該公司還擔心Llama 4在進行類似人類的語音對話時能力不如OpenAI的模型,報告補充道。
Meta計劃在今年花費高達650億美元來擴展其人工智能基礎設施,投資者對大型科技公司展示其投資回報的壓力不斷增加。
此外,中國科技公司DeepSeek的低成本熱門模型的崛起挑戰了開發最佳人工智能模型需要數十億美元的信念。
根據報告,預計Llama 4將借鑑DeepSeek的某些技術方面,並且至少有一個版本將採用一種稱為專家混合方法的機器學習技術,該技術為特定任務訓練模型的不同部分,使其在這些領域成為專家。
Meta也考慮過首先通過Meta AI推出Llama 4,然後再作為開源軟件發佈,根據報告。
去年,Meta推出了其AI模型Llama 3,基本上是免費的,可以用八種語言進行對話,編寫更高質量的計算機代碼,並解決比以前版本更復雜的數學問題。
- 建議主題:
- 技術