大模型“雲上經濟”之權力遊戲_風聞

谭婧在充电-谭婧在充电官方账号-偏爱人工智能（数据、算法、算力、场景）。-04-27 16:45

2023-04-27

文丨譚婧

光陰者百代之過客。

世人皆過客，軟件亦如此。

人工智能已有新舊之分。

網友戲稱，新人工智能是ChatGPT，舊人工智能是“之前那些”。

歷史在重演。

雲計算在美國問世的時候，否定論調居多。

一個常見的否定論調是「做生意不用上雲」。

接着，事態變化，

否定論調則調整為「大企業永遠不會上雲」。

接着，否定之聲定調為「國家級機關單位永遠不會上雲」。

美國五角大樓沒有配合，一個著名的上雲項目叫JEDI（聯合企業國防基建）。

網友吟詩曰：雲深不知處。

歷史在重演。

深度學習問世，否定論調居多。

傳統算法末日黃昏，深度學習顛覆革命。

一開始，人們還不太相信，深度學習也許只能在語音上做好。

很快發現，在計算機視覺分類問題上也可行。

再後來，基本上起初認為做不了的事情，後來都能夠做了。

GPT-4也有否定者，也需要否定者。

網友戲稱，我已經等不及要看AI失控那一天了。

歷史在重演。

強大的AI大模型，背後有微軟雲提供的澎湃算力，阿里版GPT通義千問的背後是國內最大雲廠商阿里雲。連百度都把攤在地上的百度雲扶起來，稱之為新型AI雲。

AI和雲的關係變得既感性又性感，讓我不得不思考：

ChatGPT會讓雲發生什麼？

下文中AI大模型，簡稱大模型。

第一，贏者通吃。

假如全球只有一款傲人的大模型，那麼一切想用大模型技術的企業均會成為附屬在產業上的附屬物。

傳統算法步入末法時代，雲計算不可能獨善其身。

大模型手接權杖，嘶吼咆哮：贏家通吃。

在權力遊戲中，你不當贏家就只有死路一條，沒有中間地帶。

第二，若雲廠商大模型缺位，其他類型的大模型技術擁有者會帶動生態遷移。

“好用跟我走”是一種技術咒語，咒語已經施與大模型。

傳統掌權者依然存在，徹底衰敗需要時間。

他日，誰掌握了大模型的高地，誰就可以定義未來指令集。

大模型的新生態如果不在雲上，必然會削弱雲廠商原有生態。

雲廠商制勝大模型，則強者更強。

平台即服務（PaaS）儘管也很需要，也賺錢，可惜不能帶動生態遷移。

誰掌握了大模型，誰就可以定義未來科技生態。

第三，大模型尚在早期，生態從出生到成熟，將會是一個漫長旅程。

“窗口期”是對技術先行者的饋贈。大模型效果好到令人興奮，但我們處在ChatGPT生態早期，又或者，更早期。

即使是處於早期，作為科技巨頭，你敢坐視不理，消極佈局嗎？

ChatGPT生態將會是一個漫長旅程。這意味着，參與者會是種子階段的選手。

這也意味着，大部分參與者面目模糊，終會消失。

看到ChatGPT確實把人工智能往前帶動了一大步，就鼓吹ChatGPT萬能萬用可恥。

雲計算是龐大產業，大模型未來也會是龐大產業。但仍然不要忘了，我們正處在早期。已經有企業級客户躍躍欲試生成式大模型了，但需要更多的企業級客户用起來。

當下，過度吹捧會導致市場失望和資本撤離。

做好當下，更要想以後。

第四，即使雲上有了大模型，國內雲廠商仍然會遭遇多形態的競爭對手。

當“好用跟我走”的軟件出現，硬件廠商會作何反應？對，在中國，這裏提到的硬件廠商最典型的就是華為，儘管華為也有云業務。

這次我們不講通訊產業，講AI產業。

AI產業裏，比華為雲上的AI業務更出名的是華為昇騰系列AI芯片。

假如我是華為，當我擁有一款傲人的大模型，我會把這款軟件預裝在數據中心級別的計算設備裏一起售賣。反正都要用，預裝搶市場。

這就好比預裝在手機裏的APP，優勢佔了一大截。

雲廠商形勢頗為嚴峻。

假如沒有大模型，阿里巴巴在中國會遇到不少於以下三種嚴峻而又強勢的挑戰。

一、狙擊。

獨立大模型開發商拿走雲上AI計算業務的利潤。這是結果，但過程絕不會簡單，短時間也完成不了。

二、截胡。

國內數據中心，尤其是智算中心。當智算中心擁有大模型後，可以直接輸出AI大模型能力，背後就是算力的輸出。

三、連鍋端。

獨立大模型開發者和國內智算中心合力，聯合圍剿國內雲廠商。

阿里巴巴會坐以待斃嗎？

答案顯然是否定的，儘管阿里大模型出發的時候對標的是谷歌。

谷歌有TPU，阿里有平頭哥。

平頭哥雖然不是天下第一，但是它能讓阿里雲成本降低，且不論全部替代，想想那些不能降成本的競爭對手。

谷歌的AI生態建設得非常完整和領先，包括AI芯片TPU，端到端開源深度學習框架TensorFlow。

與傳統的CPU+GPU組合相比，TPU這類專業芯片在搜索、翻譯、語音助手、圖像識別等AI任務上有數量級的性能提升。

百度也想全套對標，還比不上谷歌。

結果，晴天裏一個大霹靂，谷歌大模型輸給了微軟（和OpenAI）戰隊，儘管Bert模型對谷歌搜索引擎上的每一個基於英文的查詢提供支持，效率提升10%以上。

別人家大模型贏了，谷歌吃尾氣了，還讓大家都看到了。雖遭重擊，但谷歌比別人更有翻盤的機會。

以前都無法想象誰會超越谷歌的AI。

我們聊回阿里巴巴。

説阿里巴巴在NLP（自然語言處理）等前沿科研領域佈局多年，這話沒人反駁吧？

阿里達摩院在2018年底啓動研發，在超大模型、語言及多模態能力和訓練、平台化服務、落地應用等多個方面，為中文大模型的發展做了一些前沿性、引領性的工作。

- 2019年

發佈大規模預訓練語言模型structBERT並登頂全球NLP權威榜單GLUE；

- 2021年

先後發佈國內首個超百億參數的多模態大模型M6及語言大模型PLUG；

- 2021年8月

阿里大模型在全球機器視覺問答榜單VQA上首超人類得分；

- 2021年10月

阿里探索較低能耗訓練全球首個10萬億參數大模型M6；

- 2022年2月

M6可同時完成10餘項單模態及多模態任務。

這些非技術背景的讀者看上去意義不大的事情，如今都成了大模型的“史料”。

阿里大模型的品牌統一在“通義”之內，那些曾經被我來回理解的大模型都有了一個共同的名字。

近日，阿里“通義千問”語言大模型邀請測試，阿里成為全球較早研發並開放GPT-like大模型的科技公司之一。

譚老師我的大模型技術啓蒙是阿里巴巴給的。

跟着阿里學習大模型這些年，我獲得一個測試邀請碼不過分吧？

所以，通義千問測（翻）試（車），我們放在文章最後。

整體來看，阿里在大模型領域與引領者OpenAI尚有差距。但總體來説，阿里處於全球領先的大模型研發梯隊，具備語言大模型、多模態大模型、大模型底層訓練平台的完整佈局。

應當承認，OpenAI已是全球大模型的引領者，ChatGPT是非常優秀的模式，GPT-4在推理、數學等方面有了非常不錯的表現，是當前通義千問尚不能及的。

通義千問目前在效果上與ChatGPT還存在一定差距，仍在學習和成長。當然，通義千問也有自己較為擅長的領域，比如在文本對話、閲讀理解等方面。

好消息是，阿里應該比譚老師我更理解為何重視大模型。

就算全中國只有三個公司出手大模型，其中一個必須是阿里巴巴。

再來談談大模型走向ToB市場的抓手，即OpenAI公司的Plugin插件。

Plugin既是產品，也是方法，切不可小瞧。

Plugin插件可以成為大模型的“眼睛和耳朵”，使它們能夠接受“再訓練”，而不僅僅依靠原有訓練中的信息。

Plugin插件對於企業拿“再訓練”用好大模型這件事情起到重要作用。

有Plugin，才會有專屬模型未來的方向。

相信未來也不會只是Plugin插件的形式，大模型製造者會摸索出更好的方法。

企業通過Plugin接入GPT後，生產力會有新的提升。

比如在金融、能源或藥品企業裏，再英明神武的企業領導也需要充分的信息才能做決策，企業級大模型應用肯定要結合企業業務數據。

大模型是能力，在大模型能力技術上，企業用數據再次訓練更為重要。

不僅如此，想象大膽一些，加上機器腿和機器手，做控制和執行。

聊到機器人了。

首批熱心極客開發者已將ChatGPT接入機器人。

機器人除了聽從指揮做指定動作，還能提醒你：“你的妻子永遠都是對的。”

沒辦法，語言能力強。用強化學習根據人的反饋數據又訓練過幾輪的效果就是好，機器人的智商情商顯得很不一樣。

批量使用工業機器人的企業通過Plugin接入GPT後，生產力會有新的提升。

我們正處於一個非常漫長的旅程的起步階段，企業級的大模型應用還如星星之火。

Plugin模式一定會被國內大模型競爭者復現。但請回到第一步，你得有個好用的大模型。

動輒超千億參數的大模型研發，不是單一的算法問題，也不是靠堆積GPU實現，這是系統性工程，包括底層算力、網絡、存儲、大數據、AI框架、AI模型等。

AI+雲計算的全棧技術能力是雲廠商制勝大模型的底氣。

再看阿里，全球少數在全棧技術能力都有深度佈局、長久積累的科技公司之一，也是為數不多擁有超萬億參數大模型研發經驗的企業。

前幾天看到國內大模型競爭者們已被劃分出了派別，也不乏有人從零起步。

獨立大模型創業公司估值在2500萬美金之後，要靠業務評估估值，價格都這麼貴了，投資人也很審慎。

大模型“雲上經濟”的權力遊戲般的奇幻史詩揭幕，等待更強的人工智能降臨。

別忘了，比奪取權杖更重要的是人類命運永續。

（完）

更多閲讀

AI框架系列：

1.搞深度學習框架的那幫人，不是瘋子，就是騙子（一）

2.搞AI框架那幫人丨燎原火，賈揚清（二）

3.搞 AI 框架那幫人（三）：狂熱的 AlphaFold 和沉默的中國科學家

4.搞 AI 框架那幫人（四）：AI 框架前傳，大數據系統往事

注：（三）和（四）現在並未公開發表，將會以圖書出版的形式與各位見面。

漫畫系列

1. 解讀硅谷風投A16Z“50強”數據公司榜單

2. AI算法是兄弟，AI運維不是兄弟嗎？

3. 大數據的社交牛逼症是怎麼得的？

4. AI for Science這事，到底“科學不科學”？

5. 想幫數學家，AI算老幾？

6. 給王心凌打Call的，原來是神奇的智能湖倉

7. 原來，知識圖譜是“找關係”的搖錢樹？

8. 為什麼圖計算能正面硬剛黑色產業薅羊毛？

9. AutoML：攢錢買個“調參俠機器人”？

10.AutoML：你愛吃的火鍋底料，是機器人自動進貨

11. 強化學習：人工智能下象棋，走一步，能看幾步？

12. 時序數據庫：好險，差一點沒擠進工業製造的高端局

13. 主動學習：人工智能居然被PUA了？

14. 雲計算Serverless：一支穿雲箭，千軍萬馬來相見

15. 數據中心網絡：數據還有5納秒抵達戰場

16. 數據中心網絡“卷”AI：遲到不可怕，可怕的是別人都沒遲到

AI大模型與ChatGPT系列：

17. ChatGPT大火，如何成立一家AIGC公司，然後搞錢？

18. ChatGPT：絕不欺負文科生

19. ChatGPT觸類旁通的學習能力如何而來？

20. 獨家丨從大神Alex Smola與李沐離職AWS創業融資順利，回看ChatGPT大模型時代“底層武器”演進

21. 獨家丨前美團聯合創始人王慧文“正在收購”國產AI框架OneFlow，光年之外慾添新大將

22. ChatGPT大模型用於刑偵破案只能是虛構故事嗎？

23. “重塑商湯研發體系”“動員整個公司”，我和商湯首席科學家王曉剛聊AI大模型

DPU芯片系列：

1. 造DPU芯片，如夢幻泡影？丨虛構短篇小説

2. 永遠不要投資DPU？

3. DPU加持下的阿里雲如何做加密計算？

4. 哎呦CPU，您可別累着，兄弟CIPU在雲上幫把手

長文系列：

1. 我懷疑京東神秘部門Y，悟出智能供應鏈真相了

2. 超級計算機與人工智能：大國超算，無人領航

最後，再介紹一下主編自己吧，

我是譚婧，科技和科普題材作者。

為了在時代中發現故事，

我圍追科技大神，堵截科技公司。

偶爾寫小説，畫漫畫。

生命短暫，不走捷徑。

原創不易，多謝轉發

還想看我的文章，就關注“親愛的數據”。