張鵬對談潘亂、李翔:通義千問發佈後,阿里巴巴的下一步會怎麼走?_風聞
极客公园-极客公园官方账号-04-18 07:23

大模型會如何重塑阿里和阿里雲。
作者 | 北方
又一個國產大模型產品問世。
4 月 11 日,阿里雲峯會上,阿里巴巴集團董事會主席兼 CEO 張勇首次以阿里雲智能集團 CEO 的身份亮相,旗下大模型「通義千問」隨即面世。
不僅如此,張勇表示,阿里巴巴所有產品未來將接入「通義千問」大模型,釘釘、天貓精靈已率先接入通義千問測試,並會在評估認證後正式發佈新功能;阿里雲智能集團 CTO 周靖人稱,通義千問將基於阿里雲基礎設施向企業開放,企業可以在阿里雲上訓練企業自己的行業、垂類大模型。
通義千問的技術水平到底如何,又會如何改造阿里的業務?國產大模型紛紛登台,跟 ChatGPT 的技術差距到底如何?真的所有應用都值得用大模型重做一次嗎?
關於這些問題,極客公園創始人 & 總裁張鵬與得到 APP 總編輯李翔,亂翻書主理人潘亂,以及達摩院資深專家朱迅垚一起進行了深度探討。
01
ChatGPT 給人工智能行業的所有人上了一課
張鵬:通義千問的體驗如何?
李翔:我試着問了一下最近關心的問題,比如總結 AI 發展歷史裏關鍵的人物和典型的研究,包括人工智能技術與控制論之間的關係等,還有人工智能技術在生物醫藥領域的應用等,以我一個不瞭解生物的人的眼光來看,給的回答還是可以的。百度的文心一言我也體驗過,不過那時候沒有這樣去問,主要是去測試畫圖功能了。
潘亂:我感覺跟 ChatGPT 很類似,不同的是它不限制我的訪問,而且速度快了很多。
張鵬:一個感覺是今天這些大模型,如果你正經地去討論知識,體驗都挺好。但是你要是跟它討論人生,就有的好有的差。像是一個有知識、有推理能力能夠理解你的問題,並且能生成你想要的結果的專業助理,從這個角度來講,現在的大模型敢拿出來讓大家測,這個就要基本過關。
潘亂:阿里是什麼時候決定做大模型的?
朱迅垚:我們最早做大模型,其實從 2019 年就開始了,還屬於相對比較超前的。2019 年我們推出了預訓練大語言模型 structBERT,對 BERT 模型做了一些改進,也登頂了全球 GLUE 榜單。2021 年我們推出了第一個超過百億參數的多模態大模型 M6,還有一個大語言模型 PLUG。當時很多媒體把 PLUG 稱為中文版的 GPT-3,因為當時它就可以寫小説了。而 M6 後來成為全球最大規模的 AI 模型,第一個十萬億參數的多模態大模型。
去年 9 月我們在上海的人工智能大會上推出了通義大模型,首次在業內推出了 AI 統一底座,包括 one for all 的底座模型 M6-OFA。去年的雲棲大會上我們推出了第一個專門為模型服務的社區——魔搭社區,也首次提出了 MaaS(模型即服務)的理念。

魔塔社區首頁截圖 | 圖片來源:魔塔社區
事實上 2022 年 10 月的時候,基本的佈局就已經有了,11 月份 ChatGPT 發佈,今年 1 月份之後我們的工作開始明顯加快,我們自己的對話形態的大模型產品開始內測,也就是現在大家看到的通義千問。
李翔:達摩院其實在大模型路線上已經做了一段時間,去年OpenAI發佈 GPT-3.5 的時候,你們內部的討論和反應是怎麼樣的?
朱迅垚:首先,內部做大模型的同學是非常興奮的,ChatGPT 的產品形態教育了很多人,我們之前從來沒想到可以用這種方式讓普通人很方便地使用它,某種程度上它也教育了整個人工智能行業,原來可以這麼做。
而關於大模型的路線行業內一直有討論,之前的 BERT 是雙向語言模型,學術界之前普遍認為雙向的理解能力會更強,但是單向的 GPT 卻通過大參數和各種工程上的新方法打開了想象力,跑贏了結果。
潘亂:感覺 ChatGPT 相當於幫大家收斂了路線,之前是個開放命題,現在相當於變成了封閉命題了,變得更收斂了。至於和 ChatGPT 的差距,説完全沒差距我肯定不信,現在肯定還是存在一些差距的,只是各家的觀點不一樣。
張鵬:在這件事上我們要面對現實,去年 8 月份已經有創業者被邀請參與測試 GPT-4 了,現在可能 GPT-5 已經準備好了,在未來一段時間內肯定是被碾壓的。這是客觀事實,大家無一例外都落後,無非是落後多點還是少點。
更重要的是大方向是不是真正看準了,然後再其中全心投入去做,這個比較重要。
張鵬:本週國內的不少公司都發布了大模型產品,加上這周網信辦公佈的《生成式人工智能服務管理辦法》草案,你們怎麼看?
潘亂:我覺得政策出台是好事,是在保護創業者。先讓他們知道有這些困難,不然就像前幾年的社區創業者,段子和短視頻突然被下架,就 rag 不少人措手不及。這次明確告訴大家,如果要做這個內容,需要做好哪些準備,先把困難告訴你。
張鵬:我覺得現在還是有很多不確定性的。很多創業者的反饋主要有幾個點。
第一,巨頭們都進場了,不少創業者表示這個賽道很難做了。然後看到了政策上的比較嚴謹的限制,包括阿里這次的發佈會不是正式的產品發佈,而是一個技術進展溝通。我覺得政策倒是種降温,需要大家冷靜想一想。
02
阿里雲是大模型時代****阿里的新底座
張鵬:在看到ChatGPT之後,你們的戰略是如何調整的?
朱迅垚:這次阿里雲峯會上,我們不僅發佈了通義千問大模型,還展現了我們圍繞雲智一體的戰略決心。逍遙子在會上宣佈説他認為所有的軟件應用都值得被大模型重新構造一遍,我覺得這個判斷是一個非常重要的戰略判斷。

圖片來源:阿里雲
在這個新的技術趨勢前,我們所有人包括阿里在內,大家都是站在同一條起跑線上。逍遙子提出阿里所有產品都將接入通義千問進行改造,而且圍繞即將到來的 AIGC 浪潮,阿里雲未來也會為每家企業打造一個專屬的大模型,這是一個很長的願景,也是一個重要的戰略方向。也就是説,阿里雲不是侷限在打造自己的大模型,讓阿里所有產品都用上大模型上,而是要支撐好全社會的 AI 浪潮。
去年我們在業界首次提出了 MaaS 模型即服務這個理念,今年阿里雲面向從數字化到智能化時代的整體戰略變得更加系統和具體。阿里雲已經做好了充分準備,從 IaaS 層我們全球最大規模的飛天智算基礎設施,到 PaaS 層可以將 AI 訓練效率提升 10 倍的機器學習平台 PAI,到 MaaS 層能提供一系列基礎模型、定製大模型以及開源模型社區的模型服務,未來從訓練時代到推理時代阿里雲如何做好全面支撐等,這次都做了非常詳細的部署。

圖片來源:阿里雲
張鵬:從訓練時代到推理時代意味着什麼?
朱迅垚:訓練還是指大模型本身的訓練和調參,現在很多公司集中在這個階段進行競爭。再往後,很多公司會不想自己去造一個大模型,想直接調用大模型的能力,或者集成之後再去定製自己的能力,但再訓練的工作量會越來越小,後面更多需求是在雲上提供 AI 推理服務。看起來有些隔斷,但是其實是緊密連接的階段。就像 iPhone 的系統界面穩定後,基於這個開始出現百花齊放的應用了。
張鵬:除了這次的大模型發佈之外,大家也比較關注阿里的組織架構調整,李翔對逍遙子也是比較瞭解的,你怎麼理解阿里這次的架構調整?為什麼要調整?
李翔:有內部的壓力,也有外部的壓力吧。
外部的壓力就是競爭格局的變化,雲業務面臨的挑戰,以及電商上面對的拼多多、京東等的競爭。外部環境的變化會要求互聯網領域傳統的巨頭表現出一定的敏捷性來面對這種挑戰。
其實在內部逍遙子(張勇)在過去兩三年也在內部不斷強調組織的敏捷性。對於老牌的公司來説,公司非常龐大,敏捷性需要 CEO 和董事局不斷去強調和推動,組織太大就會帶來一定的摩擦性,但是如果把組織拆小之後,是能帶來一定敏捷性的。馬雲很早之前就説過,大象可以跳舞,但是跳一天就很困難,一個龐大的組織在靈活性上要受到地心引力的影響。
內部的壓力包括,因為互聯網公司整體股價下行的影響,可能內部有人積極性也會受到影響,因為很多人的個人回報是跟股票有關聯的。內部壓力的另外一部分也跟組織過大、業務過多有關聯,阿里涉及的業務和領域,在整個世界範圍內也是屬於非常多的,這對於管理層的能力和精力要求非常高。
所以我覺得把整個公司做這樣大的結構調整,是非常有魄力的,是希望打破大公司組織的摩擦力和阻礙。
潘亂:記得也是馬雲之前説的,做企業是藝術。但是這個其實沒有恆定的度,非常依賴 CEO 和董事長的決策和判斷,而現在的 1+6 模式,每個事業羣的總裁可以更靈活地管理公司。
按照科斯定理,企業之所以存在是因為比社會交易的成本更低,拆分後就可以以更市場化的方式提高效率,減少摩擦。另外就是增強更多人的主人翁意識,分拆後很多員工會更關心期權,關心公司能否獨立上市,這個也會更好調動大家的積極性。
張鵬:從我的視角來看,野生的生命力都強,原來都説是阿里動物園,動物園裏動物限制了戰鬥力,就不會太強。現在有不同的業務、不同的領域甚至行業,要去釋放更大的價值,野生未必是壞事。
很多時候,效率背後是要有驅動力的,一件事情要做好,既要有荷爾蒙也要有腎上腺素,荷爾蒙是長期的熱愛和追求,腎上腺素就是一些其他的激勵和鼓勵。
潘亂:其實已經發生了一些變化,我看到淘寶事業羣的調整是要更加以用户為中心,之前阿里巴巴説的都是客户第一,現在則是比較明確定義成用户第一了,這裏面還是有變化的。
張鵬:從這次發佈會上還可以得知,逍遙子是在親自負責阿里雲,想知道阿里現在如何定義阿里雲,雖然現在阿里沒有傳統意義上的中台了,那麼未來阿里雲對於阿里意味着什麼?
李翔:感覺整個阿里在把阿里雲視為他們下一個非常大的增長引擎。從過去阿里業務引擎的發展來看,B2B 業務是阿里巴巴的最早的引擎業務,然後是 C2C 的淘寶,然後是天貓,天貓也是逍遙子主力做的。再之後被寄予厚望的就是雲。
潘亂:首先我們可以看到,哪怕是亞馬遜或者微軟,雲都是他們最核心的業務。我們之前在聊 OpenAI 的時候,都説到微軟最終的目的可能都是為了加強它的雲的那個部分。
另外,以餐飲業為例,聊到萬店連鎖,我們會發現沒有任何一家店是靠開在一線城市能開到 1 萬家店的,蜜雪冰城是靠廣大二三線城市才達到的。阿里雲可能是雲服務裏最便宜的了,發佈會上還提到之後會更加普惠,也就是説價格還會再下降。
張鵬:我覺得阿里雲作為雲業務,對於阿里應該是一個很重要的業務基座。移動互聯網這十幾年,很多變革本質上是計算技術在推動,包括像阿里雲這樣的雲計算也起到了一定的作用。OpenAI 這次推出的 ChatGPT,很多人也認為是在重新定義計算。如果阿里的目標還是讓天下沒有難做的生意,推動底層技術的新變化,那我覺得大概率在雲這件事上的進化是它下一階段的重要目標。那作為 CEO 還是要抓這個對其他業務來説重要的一個基座,這個基座不只是給阿里用,也會給社會更多人服務。
但我其實很好奇,逍遙子的性格是怎麼樣的,他是因為這件事比較確定採取抓,還是因為這件事比較不確定?
李翔:我覺得是因為這件事兼具確定性和不確定性。
確定性,是因為它確定的是對整個公司、甚至於下一波浪潮裏非常重要的一件事。不確定性則是因為,大模型和它本身商業化的路徑,還有技術演變的具體路徑存在不確定性。有點類似於所有人都知道路在那裏,但是具體會遇到什麼問題,怎麼到終點等,這是不確定的。
至於逍遙子本身,我覺得是屬於比較穩同時也很有擔當的管理者。之前去負責天貓的業務,當時他其實是整個淘寶的 CFO,是以淘寶 CFO 的身份去做一個業務的總裁。他還是蠻敢於堅持做自己認定的東西的,也比較享受自己上手去做事情。
張鵬:發佈會上,説釘釘、淘寶都會接入通義千問,想象一下,阿里的其他平台接入後會帶來什麼改變?
潘亂:感覺會有一些基礎事務型的功能,比如發佈會上介紹的文章摘要生成代辦事項等。
如果用在淘寶天貓上,對於商家和消費者應該是不同的。對於商家來説可以完成很多事務性的工作,比如生成描述文案,而有了多模態功能之後,商家可能都不需要找模特拍攝照片和製作視頻了。另外還能解決營銷側的內容生成的問題。
對於消費者來説,可能就不需要再去篩選了,你可以非常清晰地表達你的需求,它就可以完成各種服務,比如你説要去某個城市,可能就可以把幫你把機票、行程、酒店等都規劃好,甚至還可以直接付款。
張鵬:這樣的話,現在的信息流的推薦形式未來肯定會被改變,這對於阿里來説會帶來什麼樣的影響?
李翔:對於平台上商家的集中度可能會有蠻大的影響的。亞馬遜的 Echo 音箱其實現在也可以實現一鍵下單,不過目前只限於亞馬遜自營商品。如果這項技術全面應用於電子商務的話,感覺會對整個商家系統帶來非常大的影響。
潘亂:發佈會當天我發了一篇文章《內容的容器大於內容本身》,把麥克盧漢的媒介與信息做了一個不同維度的翻譯。現在絕大部分的服務到最後其實是通過三種路徑讓消費者去達成交易的:搜索、推薦和直播,嚴格來看的話,其實都不是效率最高的路徑。而且現在平台經常在這些路徑里加入各種廣告,干預你的信息處理過程。
現在大模型出來之後,比爾·蓋茨認為這件事是等同於圖形界面這個界別的事情。那這種信息呈現的形式,可能要變革掉現在所有基於圖形界面所創立的商業模式。用户不需要去篩選,也不會被打擾,就可以獲得最好的服務。在這個過程中,用户看到的內容是一定會變的,只是變化時間和速度的問題。而不變的是,商家還是要供給、做履約和服務。
李翔:我覺得藉助人工智能來做購物只是其中的一部分,只是消費的一條路徑。就像女生逛街,或者我媽去逛菜市場,這其實不是一個高效率的解決方案,但是她很享受這個過程。極端情況下當然可能就像谷歌搜索的頁面一樣,你在搜索框提出需求,然後頁面會直接滿足你的需求,但這不是全部的解決方案。
人類的消費習慣確實會呈現多樣性的表現,直播電商也不是效率最高的購物方式,淘寶和拼多多也在強調它們的用户時長和用户粘性。從增加用户時長和用户粘性這個角度來看,更像是內容平台希望去做的事情,但是現在電商公司也希望這樣做。
由高效的人工智能助手完成整個購物過程,其實是效率導向。現在互聯網電商的商業模式會受到非常大的衝擊,因為我們現在還不清楚像 ChatGPT 這樣的人工智能會根據什麼邏輯去匹配用户的需求選擇產品,也不知道商家的多樣性是不是人工智能會考量的指標。
03
**未來不止一個大模型,**新產品更考驗產品經理的想象力
李翔:大模型競爭未來的格局會是怎麼樣的?創業公司和巨頭們都會以什麼樣的姿態參與這場競爭?
張鵬:今天説做大模型,甚至説做中國的 OpenAI,需要思考你到底要做哪一年的 OpenAI,2015 年、2018 年還是還是去年的?對於創業者來説,想複製 OpenAI,實際上是非常有挑戰的,因為你不知道要複製什麼狀態的 OpenAI。
而且今天的 OpenAI,已經有了自己的 super App——ChatGPT,數據飛輪在不斷優化,同時又有了 plugins 的功能,甚至接下來它可能會開始投資生態,這一套下來,它越來越像一個操作系統,想複製的話,挑戰還是很大的,可能需要找一些不同的方式,需要更高的一個效率。所以我認為國內不管是大廠還是其他創業者,想做大模型,都很難完全照搬 OpenAI 的經驗。

圖片來源:視覺中國
潘亂:首先這個領域發展太快了,幾乎每週甚至每天都有新的產品和技術發佈,所以我們今天説的所有可能很快都不成立了。
另外就是大模型本身,未來也不排除會有開源模型主導,就像現在的瀏覽器,基本都是基於一個內核開發的。逍遙子這次也説未來不一定只是一個模型,可能還有其他的模型,比如在通用之外更專精的模型。
然後聊天這種形式未必就是交互的全部了,美國的實驗室裏已經有人試圖把大模型和機器人結合了,天貓精靈的語音交互或許也是其中一種形式。
在模型之外,另外一個維度是看誰能夠幫助用户更好地去搭建 AI 應用,提高開發者的效率。
朱迅垚:國內大模型跟 OpenAI 的差距還是很大,但是從技術角度來講,我們是有信心的。基礎的原理上並沒有那麼神秘,工程化能力他們很強,但假以時日,國內也未必不能趕上。同時技術人員對於真正的 AGI 的追求是不會停止的,對阿里來説通義千問並不是大模型的重點,只是中間態的探索。至於終局,上層一定是百花齊放的應用,但是會不會有一個統一的入口,比如像 Android 或者 iOS 那樣,也許有,也許會有更激烈的競爭,但做基礎模型的最終可能不會有太多的玩家。
張鵬:如果所有行業都值得被重新做一遍,大模型對於其他行業的再造會是怎麼樣的?
朱迅垚:微軟的 Office 和 Teams 就是非常好的案例。我們又到了一個考驗產品經理想象力的時代了,而且這個產品經理的領域會更廣闊。
場景的話,比如金融行業,有很多信息和很多報告,日常調取的時候不是很方便,有沒有可能 AI 的自然語言去查詢,而替代之前的菜單式交互。如果我們把這些知識都灌給大模型,查詢方式會不會發生大的變化?
潘亂:我倒是覺得內容領域更容易發生變化,因為金融對於準確性要求太高,不能出錯,現在的大模型還是容易一本正經地胡説八道。
張鵬:隨着大模型帶來的智能能力的提升,會不會再來一波智能音箱大戰呢?
潘亂:以後的小朋友可能更喜歡跟音箱聊天,雖然現在的語音助手還是有點人工智障,但是在大模型的加持下,之後可能可以跟人做持續的情感溝通,一直陪小朋友聊天,對人的理解也是越來越深。
還有就是阿里雲峯會上介紹的釘釘,以後釘釘能不能直接幫我生成行程代辦,這樣我就不用自己去更新日曆了。
李翔:蠻期待技術迭代之後的智能音箱,語音本身也被認為是一個交互的入口。
剛才提到的金融我也覺得蠻難的,因為用户對它的準確性會有很高的要求,容忍度比較低,而且金融還有嚴格的牌照限制,遇到的問題還蠻多的。
我個人比較看好大模型應用在醫院的系統裏,能夠在患者第一次到醫院的時候,很明確告訴用户看診的流程,掛什麼科室約哪位專家等,這是很值得期待的。
潘亂:其實像法律、健康、情感或者心理諮詢等這種需要 1V1 服務的,之前的供給都不夠,而且絕大多數的供給未必能到很高的質量。AI 應該可以在相對短的時間內超過平均線,達到可用級別。
現在大家還是在競爭大模型,以後競爭應用的時候,我覺得一定會有人去奪取高地,也就是一站式服務的超級應用,比如一站式提供法律、教育、情感等專業服務的超級應用。
張鵬:從技術角度來看,今天的大模型距離我們剛才的設想,本身還有多少差距?
朱迅垚:不少設想基本是基於現在的模態進行的設想了,主要的差距主要是理解得不夠準確、生成的內容不夠可靠,這個是 GPT-4 還沒有完全解決好的。
但是隨着 AI 神經網絡本身構建的進步,以及工程化能力的提高,生成質量會不斷提高,不一定是完全準確,能達到目前搜索引擎的準確度就夠了。
但是我認為大模型本身的技術進步和產品化,還是需要想象力的。比如 2007 年手機觸摸屏的技術和軟硬件都具備了,只有喬布斯把 iPhone 做出來了。現在需要更多產品上的想象力。
張鵬:今天大模型確實給我們展示了非常大的可能性,但是很多場景的落地,其實看的不是技術的上限,而是技術的底線。比如金融、自動駕駛等,需要儘可能減少失誤的發生。而底線的提升需要大模型的技術的發展,需要大量的人花大量的精力才能實現。
對阿里雲的期待,不是技術上多麼高精尖,而是在多少行業裏把底線拉上去了,只有推動了這個才有行業的改變。過去阿里雲在中國的電商發展和雲計算歷史做了很多推動的事情,我覺得這是阿里雲的風格,也期待能做更多。
*頭圖來源:視覺中國
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO