Meta本月即將發佈新的AI模型Llama 4,信息報道 | 路透社
Reuters
Meta的標誌在瑞士達沃斯公司臨時展位的入口處可見,2025年1月18日。路透社/Yves Herman/檔案照片4月4日(路透社)- Meta Platforms(META.O)計劃在本月晚些時候發佈其大型語言模型的最新版本,此前已至少推遲了兩次,信息網站週五報道,作為Facebook的擁有者,Meta正在努力在人工智能競賽中領先。然而,Meta可能會再次推遲Llama 4的發佈,該報告稱,引用了兩位熟悉此事的人士。
路透社日報簡報提供您開始一天所需的所有新聞。註冊這裏。
大型科技公司在OpenAI的ChatGPT成功後,積極投資於人工智能基礎設施,這改變了科技格局並推動了機器學習的投資。
報告稱,推遲的原因之一是在開發過程中,Llama 4未能滿足Meta在技術基準方面的期望,特別是在推理和數學任務上。
該公司還擔心Llama 4在進行類人語音對話方面的能力不如OpenAI的模型,報告補充道。
Meta計劃在今年花費多達650億美元來擴展其人工智能基礎設施,因投資者對大型科技公司施加壓力,要求其展示投資回報。此外,中國科技公司 DeepSeek 的流行低成本模型的崛起挑戰了開發最佳AI模型需要數十億美元的信念。報告稱,Llama 4預計將借鑑DeepSeek的某些技術方面,至少有一個版本計劃採用一種稱為專家混合方法的機器學習技術,該技術為特定任務訓練模型的不同部分,使它們在這些領域成為專家。
報告還稱,Meta也考慮先通過Meta AI發佈Llama 4,然後再作為開源軟件發佈。
去年,Meta發佈了其大部分免費的Llama 3 AI模型,該模型可以用八種語言進行對話,編寫更高質量的計算機代碼,並解決比以前版本更復雜的數學問題。* 建議主題:
- 人工智能