Meta發佈了最大的Llama 3 AI模型,宣傳其語言和數學能力的提升 | 路透社
Katie Paul
Meta AI 標誌在2023年9月28日拍攝的插圖中可見。路透社/Dado Ruvic/插圖/檔案照片紐約,7月23日(路透社) - Meta Platforms (META.O)於週二發佈了其大部分免費 Llama 3 人工智能模型的最大版本, boasting 多語言技能和一般性能指標,緊追 OpenAI 等競爭對手的付費模型。Facebook 母公司表示,新 Llama 3 模型可以用八種語言進行對話,編寫更高質量的計算機代碼,並解決比以前版本更復雜的數學問題,這些信息在博客文章和發佈公告的研究論文中提到。
該模型擁有4050億個參數,即算法在生成用户查詢響應時考慮的變量,遠超去年發佈的 前一個版本,但仍小於競爭對手提供的領先模型。相比之下,OpenAI 的 GPT-4 模型據報道擁有一萬億個參數,而亞馬遜正在 準備一個模型,其參數達到2萬億。首席執行官馬克·扎克伯格在多個渠道推廣 Llama 3 時表示,他預計未來的 Llama 模型將在明年超越專有競爭對手。他表示,由這些模型驅動的 Meta AI 聊天機器人有望在今年年底成為最受歡迎的 AI 助手,目前已有數億人使用它。
此次發佈是在科技公司競相展示其日益增長的資源密集型大型語言模型能夠在 已知問題領域如高級推理中帶來足夠顯著的收益,以證明對它們的鉅額投資是合理的。Meta的首席AI科學家表示,他相信這些模型將在推理方面遇到限制,其他類型的AI系統將需要產生突破。
除了其旗艦的4050億參數模型外,Meta還發布了其輕量級的80億和700億參數Llama 3模型的更新版本,最初 在春季推出,該公司表示。這三種新模型都是多語言的,並且可以通過擴展的“上下文窗口”處理更大的用户請求,Meta的生成AI負責人Ahmad Al-Dahle表示,這將特別改善生成計算機代碼的體驗。
“這是我們從社區獲得的第一反饋,”Al-Dahle在接受路透社採訪時表示,並指出更大的上下文窗口給模型提供了類似於更長記憶的東西,有助於處理多步驟請求。
此外,Al-Dahle表示,他的團隊能夠通過使用AI生成一些用於訓練的數據來提高Llama 3模型在解決數學問題等任務上的表現。
Meta將其Llama模型大部分免費提供給開發者使用,扎克伯格表示,這一策略將以創新產品、減少對潛在競爭對手的依賴以及在公司核心社交網絡上增加參與度的形式獲得回報。一些投資者已經 揚起了眉毛 對所涉及的成本,然而。如果開發者選擇使用其免費的模型而不是付費模型,公司也將受益,這將削弱其競爭對手的商業模式。隨着這一公告,Meta 宣傳了在關鍵數學和知識測試中的進展,這可能使這一前景更具吸引力。
儘管衡量人工智能發展的進展 notoriously 困難,但 Meta 提供的測試結果似乎表明,其最大的 Llama 3 模型幾乎與 Anthropic 的 Claude 3.5 Sonnet 和 OpenAI 的 GPT-4o 相匹敵,在某些情況下甚至超越了它們,這兩者被廣泛認為是市場上最強大的前沿模型。
例如,在 MATH 基準的競爭級數學文字問題中,Meta 的模型得分為 73.8,而 GPT-4o 的得分為 76.6,Claude 3.5 Sonnet 的得分為 71.1。
該模型在 MMLU 上得分 88.6,MMLU 是一個涵蓋數學、科學和人文學科多個學科的基準,而 GPT-4o 得分 88.7,Claude 3.5 Sonnet 得分 88.3。
在他們的論文中,Meta 的研究人員還預告了即將在今年晚些時候推出的“多模態”版本模型,這些模型將在核心 Llama 3 文本模型的基礎上疊加圖像、視頻和語音能力。
他們表示,早期實驗表明,這些模型可以與其他多模態模型如谷歌的 Gemini 1.5 和 Anthropic 的 Claude 3.5 Sonnet “具有競爭力”。
通過《競選之路》時事通訊獲取每週關於美國選舉的新聞和分析,以及其對世界的影響。註冊 這裏。