Meta發佈了其Llama 3人工智能模型的早期版本 | 路透社

Katie Paul

2024-04-19

Meta首席執行官馬克·扎克伯格在Meta Connect活動上發表講話，屏幕上顯示人工智能的字樣，地點為Meta總部，位於美國加利福尼亞州門洛帕克，2023年9月27日。路透社/卡洛斯·巴里亞/文件照片紐約，4月18日（路透社）- Meta平台 (META.O)於週四發佈了其最新大型語言模型Llama 3的早期版本，以及一個圖像生成器，可以在用户輸入提示時實時更新圖片，以趕上生成式人工智能市場領導者OpenAI。這些模型將集成到其虛擬助手Meta AI中，該公司將其推銷為最複雜的免費同行產品之一，引用了在推理、編碼和創意寫作等主題上與包括字母表的競爭對手在內的對手的性能比較，如谷歌和法國初創公司Mistral AI。更新後的Meta AI助手將在Meta的Facebook、Instagram、WhatsApp和Messenger應用程序中獲得更突出的位置，以及一個新的獨立網站，使其更直接地與微軟支持的OpenAI的熱門產品ChatGPT競爭。該網站上迎接訪客的登陸頁面提示他們嘗試讓助手創建度假裝備清單，與他們一起玩1990年代音樂問答遊戲，提供作業幫助，並繪製紐約市天際線的圖片。

Meta一直在竭力推出生成式人工智能產品，以挑戰OpenAI在技術領域的領先地位，這涉及到對計算基礎設施的昂貴改造以及之前獨立的研究和產品團隊的整合。這家社交媒體巨頭一直在公開發布其Llama模型，供開發人員在構建人工智能應用程序時使用，作為其趕上步伐的努力的一部分，因為強大的免費選項可能會阻礙競爭對手通過其專有技術賺取收入的計劃。這一策略引起了批評者的安全擔憂，他們擔心不道德的行為者可能會利用該模型進行構建。

Meta為Llama 3配備了新的計算編碼能力，並在訓練過程中輸入了圖像和文本，儘管目前該模型只會輸出文本，Meta首席產品官克里斯·考克斯在接受採訪時表示。

他補充説，更先進的推理能力，比如制定更長的多步計劃的能力，將在隨後的版本中推出。Meta在博客文章中表示，計劃在未來幾個月發佈的版本還將具備“多模態”功能，意味着它們可以生成文本和圖像。

“最終的目標是幫助減輕你的負擔，只是幫助讓你的生活更輕鬆，無論是與企業互動，還是寫作，還是計劃旅行，”考克斯説。

考克斯表示，將圖像納入Llama 3的訓練將增強今年推出的Ray-Ban Meta智能眼鏡的更新。使用眼鏡製造商Essilor Luxoticca(ESLX.PA)製造的產品，使Meta AI能夠識別佩戴者所見物體並回答有關它們的問題。週四晚間，Meta股價上漲了1.8%。

Meta還宣佈與谷歌合作，將其實時搜索結果納入助手的回應中，補充了與微軟必應搜索引擎的現有安排。

Meta AI助手正在擴展到美國以外的十多個市場，包括澳大利亞、加拿大、新加坡、尼日利亞和巴基斯坦。Cox表示，Meta正在“努力尋找在歐洲這樣做的正確方式”，那裏的隱私規定更為嚴格，即將出台的AI法案可能會要求披露模型的訓練數據等要求。生成式AI模型對數據的貪婪需求已經成為技術發展中的一大緊張源。Meta首席執行官馬克·扎克伯格在一段附帶公告的視頻中提到了與OpenAI的競爭，他稱Meta AI為“您可以自由使用的最智能的AI助手”。

扎克伯格表示，現在推出的Llama 3的兩個較小版本，分別具有80億和700億參數，在常用於評估模型質量的性能基準上得分優異。他説，Llama 3的最大版本仍在訓練中，具有4000億參數。

這些結果“無疑令人印象深刻”，但也表明了免費和專有模型之間性能差距不斷擴大，AI初創公司Air Street Capital的創始人Nathan Benaich表示。

開發人員抱怨説，模型的上一個Llama 2版本未能理解基本上下文，將關於“殺死”計算機程序的查詢與請求指導如何犯罪混淆在一起。競爭對手谷歌也遇到了類似問題，並最近暫停使用其Gemini AI圖像生成工具，因為該工具因生成不準確的歷史人物形象而受到批評。Meta表示，通過使用“高質量數據”來讓Llama 3識別細微差別，已經減少了這些問題。雖然Meta沒有詳細説明使用的數據集，但它表示，與Llama 2相比，它向Llama 3輸入的數據量增加了七倍。

Technology Roundup通訊將最新消息和趨勢直接發送到您的收件箱。在這裏註冊。