通義千問大模型升級,阿里雲準備為AI發電_風聞
知危-知危官方账号-11-01 09:14
一年一度雲棲大會,阿里雲的通義千問大模型升級了。
官方態度比較低調,“ 加速追趕 GPT-4 ”。
事情可能並不簡單,比起 4 月發佈的 1.0 版,通義千問 2.0 的參數規模達到 “ 千億級 ”,但官方沒説是一千億、兩千億還是五千億。
只知道在十多個權威評測中,通義千問 2.0 的綜合性能超越 GPT-3.5,測評得分是 9 勝 1 負。跟 GPT-4 比,4 勝 6 負,還差那麼一截。
據瞭解,比起舊版,通義千問 2.0 在處理複雜的指令理解、文學創作、通用數學、知識記憶以及幻覺抵禦等多個方面的表現都有顯著提升。還專門針對指令遵循、工具使用、精細化創作做了技術優化,目的是 “ 更好地被下游應用集成 ”。
好不好用,還是得測過了才知道。知危編輯部按照 “ 國際慣例 ”,做了一把測評。
只不過,大模型發展到今天,再像早期那樣反覆玩 “ 弱智吧大戰 AI ” ,意義已經不大了。對於大多數人來講,看樂子是一時的。大家真正想看的,還是大模型能不能真正成為一個日常生活輔助工具,甚至是生產力工具。
所以,我們也來了次測試升級,不再按照簡單問幾個問題就來判斷好壞,而是儘可能給出詳盡的提示詞和要求,看看在面對實際生活工作中的實際需求時,大模型會如何應對。
我們先試一個簡單的文學能力。讓通義千問先為這屆杭州亞運會作一首五言絕句詩,再讓它針對本屆杭州亞運會的特色,按照盛唐詩人的風格寫一首七言律詩:

水平還可以,抓住了盛唐風格的味道,每句結尾都實現了押韻,提到的亞運會幾個主要特點也都囊括在內了。
下面我們預設了一個生活中常見的男女朋友吵架的情況,讓通義千問幫男生出謀劃策,針對道歉給出具體的規劃:

這個問題的回答有些泛泛而談,我們進一步提問了具體的措施:

調整後的建議就相當到位了,比如雖然提醒男生可以送禮物,但還額外點出了 “ 不要將此作為道歉的主要手段 ”。
就連約會地點都很貼心地建議了 “ 曾經去過的地方 ”。
編輯部的女同事看了之後,都表示這個計劃 “ 很會 ”。
由於雙11即將來臨,我們又給了通義千問一個直播腳本的案例,讓它寫出一個 “ 能講清楚賣點、直擊買家的日常痛點 ” 的電動牙刷直播帶貨腳本。

雖然整體框架和我們給到範例差別不大,但在內部的一些話術設置上,還是有些東西的。
例如在逼單環節用上了 “ 不要等到牙痛的時候,才後悔沒有好好愛護牙齒 ” 的説辭,對用户的 “ 拿捏 ” 程度還是較高的。
相信如果提示詞更詳盡、幾輪調教下來,肯定還會有更大的提升。
而對於另一類大需求代碼能力,我們先測了一個 python 的代碼能力:

在本地運行後是這樣的:

不得不説還是可以的。
接着,我們又嘗試讓它寫一個實用性強一點的 HTML 頁面 :

最後呈現效果如下:

通義還貼心地提醒圖片需要自己上傳、交互部分需要找其他後端工程師補齊。

我們諮詢了一位資深前端工程師,在她看來,雖然目前的例子比較簡單、粗糙,但起碼給的要求都完成了,“ 如果提示詞更到位,在實際造輪子的過程中也許能派上用場 ”。
好了,編輯部的測試大概就節選這麼多,大家有興趣的話,可以直接去通義千問官網或者今天上線的通義千問 APP 上測試。
在我們看來,這次升級後的通義千問的確相較剛發佈時有了明顯的提升,在同行們都在狂奔向前的時候,它以這個實力站穩在國產第一梯隊問題不大。
但,一些剛上的新功能使用體驗還是有待優化,例如此次上線的圖片理解功能,目前只能最基本地分析圖裏有什麼。

縱觀整個雲棲大會的發佈,通義千問 2.0 並不佔據最大篇幅。阿里巴巴集團董事會主席蔡崇信明確表達了阿里雲的 “ 第一身位 ”:“ 不開放就沒有生態,沒有生態就沒有未來,阿里雲要做 AI 時代最開放的雲 ”。

作為雲計算廠商的阿里雲,從頭到尾都在向整個大模型行業釋放歡迎的信號。
比如,本屆雲棲大會有個重要發佈 —— 一站式大模型應用開發平台 “ 阿里雲百鍊 ”,封裝好大模型,為企業和開發者提供專屬模型訓練和模型應用開發的服務。但阿里雲百鍊上的模型,遠遠不止通義千問,還集成了大量優質的國內外開源大模型。
眼下,千行百業都想借助大模型的能力實現業務升級,但大模型方面對於技術、人才高門檻,讓大量企業望而卻步。
阿里雲百鍊平台,就是要讓各個企業、開發者利用平台的各種工具、流程,大大降低行業/企業向的大模型及大模型應用的開發、部署門檻。

對於需要訓練專屬模型的用户,也能夠在平台上直接進行快捷的數據處理、微調訓練、模型評估等等。
對於需要開發大模型應用的用户,阿里雲百鍊平台則是採用了全新的應用範式,創建了一套便捷的開發界面,編輯部簡單體驗了下,感覺上手操作難度確實不高。
理論上,開發者可在 5 分鐘內開發一款大模型應用,幾小時即可 “ 煉 ” 出一個企業專屬模型。
這麼一來,開發者能夠免去造輪子費的力氣,把更多的重心和精力專注在大模型在行業內的應用創新上。
阿里雲百鍊平台,已經有了不少成功的落地案例。
據知危瞭解,朗新科技、央視網、亞信科技等均已在阿里雲百鍊平台上成功開發了專屬模型和應用。
以朗新科技為例,他們引入基於垂直領域專屬大模型擬人化、角色化的 “ 電力賬單解讀智能助手 ” 後,大大縮短了客户諮詢流程,諮詢效率提高了 50% 以上,還將與電費相關的客户投訴率降低了七成以上。

與朗新科技類似,很多企業急需一個高度行業向、企業向的專屬大模型,可以説這是當下 AI 大模型的一個落地剛需。
事實上,自大模型浪潮興起以來,阿里雲就在做開源開放這件事。
今年 8 月起,阿里雲在國內大廠中率先開源自研的通義千問大模型,陸續開出 7B、14B 參數版本。今天,阿里雲CTO 周靖人現場表態,11 月份將開源 72B( 720 億 )參數版本。這將會是參數規模最大的中國開源大模型。
去年雲棲大會,阿里雲牽頭建設了 AI 模型開源社區魔搭 ModelScope。時隔短短一年,就發展成為中國最大的AI模型社區, 匯聚了 2300 +款 AI 模型,吸引了 280 萬名 AI 開發者,成為中國大模型開源第一門户。
百川智能、智譜 AI、上海人工智能實驗室等頭部機構都把魔搭作為自家模型開源首發平台。

沒有云計算,就沒有大模型。阿里雲的野心,是大模型時代提供 AI 算力基礎設施。事實上,目前中國大模型企業有超過一半跑在阿里雲上。
阿里雲創始人王堅説,雲計算和 GPT 的關係,就是電和電機的關係。
阿里雲想做那個為 AI 發電的角色。