智譜 AI 推出新一代基座大模型 GLM-4,能力逼近 GPT-4_風聞
极客公园-极客公园官方账号-39分钟前

最接近 OpenAI 的中國追趕者,拿出了逼近 GPT-4 的超強大模型。
作者 | 連冉
編輯 | 鄭玄
1 月 16 日,智譜 AI 在其首屆技術開放日(Zhipu DevDay)正式發佈了新一代基座大模型 GLM-4。
據智譜AICEO****張鵬介紹,**GLM-4 的整體性能相比上一代大幅提升,逼近 GPT-4。**它可以支持更長的上下文,具備更強的多模態能力。同時,它的推理速度更快,支持更高的併發,大大降低推理成本。
除此之外,GLM-4 大幅提升了智能體能力,GLM-4 All Tools 實現自主根據用户意圖,自動理解、規劃複雜指令,自由調用網頁瀏覽器、Code Interpreter 代碼解釋器和多模態文生圖大模型以完成複雜任務。GLMs 個性化智能體定製功能亦同時上線,用户用簡單的提示詞指令就能創建屬於自己的 GLM 智能體。
演講中,張鵬回顧了大模型行業和智譜 AI 過去五年的發展歷程。他坦言,由於起步晚、算力受限等因素的制約,今天國內大模型與國外最先進的團隊還有將近一年的差距。張鵬沒有迴避智譜 AI 依然是「追趕者」的事實。而拿出性能非常逼近 GPT-4 的 GLM-4,智譜 AI 已經踐行了自己去年年初定下的承諾。
01
GLM-4:多模態、長文本、智能體
智譜 AI 表示,此次發佈的 GLM-4,在多個評測集上性能已接近或超過 GPT-3.5,個別項目上幾乎持平 GPT-4。其中以下四個能力更新,是 GLM-4 最大的亮點:
多模態能力:推出了 CogView3 代,效果超過開源 SD 模型,逼近 DALLE-3。
All Tools 能力:GLM-4 能自主理解複雜指令,自由調用 WebGLM 搜索增強、Code Interpreter 代碼解釋器和多模態生成能力,完成複雜任務。
GLMs 個性化智能體定製:用户可以通過智譜清言官方網站創建屬於自己的 GLM 智能體,無需編程基礎。
MaaS 平台和****API:GLM-4 登陸了 Maas 平台,提供 API 訪問,支持開發者內測 Assistant API。
具體來説,GLM-4 可以支持 128k 的上下文窗口長度,單次提示詞可以處理的文本可以達到 300 頁。同時,在 needle test(大海撈針)測試中,128K 文本長度內 GLM-4 模型均可做到幾乎 100% 的精度召回,並未出現長上下文全局信息因為失焦而導致的精度下降問題。同時,多模態能力方面,文生圖和多模態理解都得到了增強。

GLM-4 多模態能力展示| 圖片來源:智譜 AI
此外,GLM-4 的 All Tools 能力全新發布。得益於 GLM 模型的強大 Agent 能力,GLM-4 實現了自主根據用户意圖,自動理解、規劃複雜指令,自由調用網頁瀏覽器、Code Interpreter 代碼解釋器和文生圖 CogView3 模型。
同時,GLM-4 通過代碼解釋器,會自動調用代碼解釋器進行復雜的方程或者微積分求解。對比 GSM8K、Math 以及 Math23K 三個數據集上的結果,GLM-4 All Tools 取得和 GPT-4 All Tools 相當的效果。GLM-4 的 All Tools 能力完全自動,而且可以處理各種任務,比如包括文件處理、數據分析、圖表繪製等複雜任務,支持處理 Excel、PDF、PPT 等格式的文件。
**為降低大模型使用門檻,GLMs 個性化智能體定製能力也同步上線。**基於 GLM-4 模型的強大能力,用户只要登錄智譜清言官方網站,用簡單的提示詞指令就能創建屬於自己的 GLM 智能體。
並且,用户可以通過全新上線的智能體中心分享自己創建的各種智能體。GLM 模型智能體的推出,標誌着任何人都能夠自由運用 GLM-4 模型並挖掘它的潛力,即使沒有任何編程基礎,也能夠實現大模型的便捷開發,這也是擴大大模型開發者社區生態的一次進步。
這個功能一經推出,就在行業內引起熱議。去年 11 月 OpenAI 推出 GPTs 以來,智能體已經成為當下大模型賽道最熱門的落地方向,也被認為是打造大模型行業生態的重要基石。
此前,智譜 AI 分別聯合 CCF 中國計算機學會、中國中文信息學會社會媒體處理專委會發起了 CCF-智譜大模型基金、SMP-智譜大模型交叉學科基金,用於支持大模型理論、算法、模型、應用等相關研究和跨領域交叉創新。
去年,兩支基金為來自全國三十餘所高校參與的 41 個研究項目累計提供了超 1000 萬元現金和算力資源的科研支持。
2024 年,智譜AI也將發起開源開放的大模型開源基金,該計劃包括三個「一千」:
智譜 AI 將為大模型開源社區提供一千張卡,助力開源開發;
提供 1000 萬元的現金用來支持與大模型相關的開源項目;
為優秀的開源開發者提供 1000 億免費 API tokens。
張鵬表示,大模型開源基金的目的在於推動大模型研發的大進展,促進大模型整個開源生態的大繁榮。面對全球的大模型創業者,智譜 AI 也將「Z 計劃」進一步升級,聯合生態夥伴發起總額 10 億人民幣的大模型創業基金用於支持大模型原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等方向。
02
2024 年是 AGI 元年,但路還長
在上午的演講中,智譜 AI CEO 張鵬談到,大模型是當前人工智能研究和應用的熱點,被認為是通向通用人工智能的關鍵途徑,也是國際科技競爭的焦點。從 2017 年的 Transformer 架構,到 BERT、GPT 系列等模型的推出,這些年來,大模型在算法創新、模型規模和應用領域都取得了顯著進步,剛剛到來的 2024 年是 AGI 元年,但路還很長。
在演講中,張鵬回顧了大模型行業和智譜,在過去 5 年的發展歷程:

智譜 AI CEO 張鵬 | 圖片來源:智譜 AI
2018-2020:
大模型的算法創新年
2017 年,谷歌提出了 Transformer 機器學習模型架構,迅速席捲了整個人工智能研究領域,成為自然語言處理等相關研究的主要方法,2018 到 2020 年,業內先後出現了 BERT、GPT/GPT-2/GPT-3、T5 等基於大規模無標註數據自監督學習的大規模預訓練算法,可以説 2018-2020 年是大模型的算法創新年,在這段時間,智譜 AI 研發了屬於自己的算法 GLM。
2020-2022 年:
模型之爭開始
2020 到 2022 年,模型之爭開始,基於各種預訓練模型框架和開源項目,各種模型如雨後春筍般誕生。2020 年的 GPT-3,擁有 1750 億參數,可以被視作這一戰的起點,它開啓了基座模型的全新時代,其在語言生成、上下文學習和知識理解等方面展現出驚人能力。
隨後全球範圍內掀起了一股大模型研究和研發的熱潮,谷歌、Meta 等國際領先公司開始不斷髮布百億到千億規模的大型語言模型,例如 Gopher(2021 年)、Chinchilla(2022 年)、PaLM(2022 年)、Claude(2022 年)等等,但是這些模型都不開源,因此開源大語言模型也開始受到關注,比如 META 的 OPT(2022 年)、BLOOM(2022 年)、LLAMA(2023 年)。
智譜 AI 則選擇在 2022 年開源了自己的千億基座模型 GLM-130B,這一工作引起了全世界範圍的關注,包括頂尖高校斯坦福,還有公司 google、OpenAI、apple、meta 都對智譜 AI 的模型進行了深入分析和對比。
2023 年:
大模型出圈
2023 年,ChatGPT 推出後,大模型開始火出圈,被公眾廣為所知。大模型的發展不再僅限於模型的訓練,更重要的是如何實現模型的產業化應用落地,大模型開始在各個領域開花並且結果。
智譜 AI 在 2023 年這一年當中基於 GLM-130B 研發了 ChatGLM,歷經 3 個版本的迭代,逐步具備了多模態理解、代碼解釋、網絡搜索增強等新功能。隨後智譜 AI 聯合合作伙伴,在一年來實現了廣泛的商業應用落地。
在回顧完過去 5 年來大模型的發展後,張鵬也總結稱必須承認的一點是,和國外大模型相比,國內的大模型發展起步晚一些,加上高性能算力的限制和數據質量的差距等等,國內研發的大模型無論規模還是核心能力,與世界先進水平還存在一年左右的差距。
去年年初智譜 AI 承諾,「2023 年底智譜 AI 要實現逼近最先進的 GPT-4 性能的全棧自主創新的 GLM-4」,作為一年前定下的目標,今天可以看到,GLM-4 性能已得到明顯的提升,而「從標準的大模型評測角度看,整體上我們已經逼近了 GPT-4」。
*頭圖來源:智譜
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO