Meta推出名為“Llama”的大型語言模型AI - 彭博社
Kurt Wagner, Dina Bass
攝影師:Michael Nagle/BloombergMeta平台公司推出了一款用於構建基於人工智能的聊天機器人和其他產品的研究工具,旨在為其自身的技術在最近專注於互聯網競爭對手谷歌和微軟公司
該工具LLaMA是Meta在大型語言模型領域的最新嘗試,首席執行官馬克·扎克伯格在週五的Instagram帖子中表示:“這些模型在生成文本、進行對話、總結書面材料以及解決數學定理或預測蛋白質結構等更復雜任務方面表現出了很大的潛力。”
目前LLaMA尚未在Meta的產品中使用,包括社交網絡Facebook和Instagram,據一位發言人稱。該公司計劃向AI研究人員提供這項技術。
扎克伯格寫道:“Meta致力於這種開放式的研究模式。”
大型語言模型是龐大的人工智能系統,吸收大量的數字文本——來自新聞文章、社交媒體帖子或其他互聯網來源——並利用這些書面材料訓練軟件,使其在給定提示或查詢時能夠預測和生成內容。這些模型可用於撰寫文章、撰寫推文、生成聊天機器人對話並建議計算機編程代碼等任務。
這項技術近幾個月來變得越來越受歡迎,也引起了爭議,因為越來越多的公司開始構建這些模型並推出基於這些模型的產品測試,突顯了科技巨頭之間的新競爭領域。微軟正在向OpenAI投資數十億美元,後者是運行ChatGPT聊天機器人的大型語言模型GPT-3的製造商。這家軟件製造商本月推出了運行在OpenAI聊天技術上的必應搜索引擎的測試版本,這立即引起了人們對其有時不當回應的擔憂。
Alphabet 公司的 Google 擁有一個名為 LaMDA 的模型,或者對話應用語言模型。這家互聯網搜索和廣告領導者正在測試一款名為 Bard 的基於聊天的、由人工智能驅動的搜索產品,該產品仍然存在一些故障。
Meta 先前推出了 一個名為 OPT-175B 的大型語言模型,但 LLaMA 是一個更新且更先進的系統。Meta 去年末發佈的另一個模型 Galactica,在研究人員發現它經常向使用者分享偏見或不準確信息後迅速撤回。
Zuckerberg 已經將人工智能作為公司的重中之重,經常在收益電話會議和採訪中談論其對改進 Meta 產品的重要性。雖然 LLaMA 目前並未用於 Meta 產品,但未來有可能會使用。目前,Meta 依靠人工智能進行各種功能,包括內容管理和排名出現在用户動態中的材料。
開源 LLaMA 模型使外部人員更清楚地瞭解系統的運作方式,調整它以滿足自己的需求,並在相關項目上進行合作。去年,Big Science 和 Hugging Face 發佈了一個名為 BLOOM 的開源 LLM,旨在使這種技術更易獲取。
閲讀更多: ChatGPT 重新點燃了谷歌和微軟之間的搜索之戰