大模型“雲上經濟”之權力遊戲_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-04-27 16:45

文丨譚婧
光陰者百代之過客。
世人皆過客,軟件亦如此。
人工智能已有新舊之分。
網友戲稱,新人工智能是ChatGPT,舊人工智能是“之前那些”。
歷史在重演。
雲計算在美國問世的時候,否定論調居多。
一個常見的否定論調是「做生意不用上雲」。
接着,事態變化,
否定論調則調整為「大企業永遠不會上雲」。
接着,否定之聲定調為「國家級機關單位永遠不會上雲」。
美國五角大樓沒有配合,一個著名的上雲項目叫JEDI(聯合企業國防基建)。
網友吟詩曰:雲深不知處。
歷史在重演。
深度學習問世,否定論調居多。
傳統算法末日黃昏,深度學習顛覆革命。
一開始,人們還不太相信,深度學習也許只能在語音上做好。
很快發現,在計算機視覺分類問題上也可行。
再後來,基本上起初認為做不了的事情,後來都能夠做了。
GPT-4也有否定者,也需要否定者。
網友戲稱,我已經等不及要看AI失控那一天了。
歷史在重演。
強大的AI大模型,背後有微軟雲提供的澎湃算力,阿里版GPT通義千問的背後是國內最大雲廠商阿里雲。連百度都把攤在地上的百度雲扶起來,稱之為新型AI雲。
AI和雲的關係變得既感性又性感,讓我不得不思考:
ChatGPT會讓雲發生什麼?
下文中AI大模型,簡稱大模型。
第一,贏者通吃。
假如全球只有一款傲人的大模型,那麼一切想用大模型技術的企業均會成為附屬在產業上的附屬物。
傳統算法步入末法時代,雲計算不可能獨善其身。
大模型手接權杖,嘶吼咆哮:贏家通吃。
在權力遊戲中,你不當贏家就只有死路一條,沒有中間地帶。
第二,若雲廠商大模型缺位,其他類型的大模型技術擁有者會帶動生態遷移。
“好用跟我走”是一種技術咒語,咒語已經施與大模型。
傳統掌權者依然存在,徹底衰敗需要時間。
他日,誰掌握了大模型的高地,誰就可以定義未來指令集。
大模型的新生態如果不在雲上,必然會削弱雲廠商原有生態。
雲廠商制勝大模型,則強者更強。
平台即服務(PaaS)儘管也很需要,也賺錢,可惜不能帶動生態遷移。
誰掌握了大模型,誰就可以定義未來科技生態。
第三,大模型尚在早期,生態從出生到成熟,將會是一個漫長旅程。
“窗口期”是對技術先行者的饋贈。大模型效果好到令人興奮,但我們處在ChatGPT生態早期,又或者,更早期。
即使是處於早期,作為科技巨頭,你敢坐視不理,消極佈局嗎?
ChatGPT生態將會是一個漫長旅程。這意味着,參與者會是種子階段的選手。
這也意味着,大部分參與者面目模糊,終會消失。
看到ChatGPT確實把人工智能往前帶動了一大步,就鼓吹ChatGPT萬能萬用可恥。
雲計算是龐大產業,大模型未來也會是龐大產業。但仍然不要忘了,我們正處在早期。已經有企業級客户躍躍欲試生成式大模型了,但需要更多的企業級客户用起來。
當下,過度吹捧會導致市場失望和資本撤離。
做好當下,更要想以後。
第四,即使雲上有了大模型,國內雲廠商仍然會遭遇多形態的競爭對手。
當“好用跟我走”的軟件出現,硬件廠商會作何反應?對,在中國,這裏提到的硬件廠商最典型的就是華為,儘管華為也有云業務。
這次我們不講通訊產業,講AI產業。
AI產業裏,比華為雲上的AI業務更出名的是華為昇騰系列AI芯片。
假如我是華為,當我擁有一款傲人的大模型,我會把這款軟件預裝在數據中心級別的計算設備裏一起售賣。反正都要用,預裝搶市場。
這就好比預裝在手機裏的APP,優勢佔了一大截。
雲廠商形勢頗為嚴峻。
假如沒有大模型,阿里巴巴在中國會遇到不少於以下三種嚴峻而又強勢的挑戰。
一、狙擊。
獨立大模型開發商拿走雲上AI計算業務的利潤。這是結果,但過程絕不會簡單,短時間也完成不了。
二、截胡。
國內數據中心,尤其是智算中心。當智算中心擁有大模型後,可以直接輸出AI大模型能力,背後就是算力的輸出。
三、連鍋端。
獨立大模型開發者和國內智算中心合力,聯合圍剿國內雲廠商。
阿里巴巴會坐以待斃嗎?
答案顯然是否定的,儘管阿里大模型出發的時候對標的是谷歌。
谷歌有TPU,阿里有平頭哥。
平頭哥雖然不是天下第一,但是它能讓阿里雲成本降低,且不論全部替代,想想那些不能降成本的競爭對手。
谷歌的AI生態建設得非常完整和領先,包括AI芯片TPU,端到端開源深度學習框架TensorFlow。
與傳統的CPU+GPU組合相比,TPU這類專業芯片在搜索、翻譯、語音助手、圖像識別等AI任務上有數量級的性能提升。
百度也想全套對標,還比不上谷歌。
結果,晴天裏一個大霹靂,谷歌大模型輸給了微軟(和OpenAI)戰隊,儘管Bert模型對谷歌搜索引擎上的每一個基於英文的查詢提供支持,效率提升10%以上。
別人家大模型贏了,谷歌吃尾氣了,還讓大家都看到了。雖遭重擊,但谷歌比別人更有翻盤的機會。
以前都無法想象誰會超越谷歌的AI。
我們聊回阿里巴巴。
説阿里巴巴在NLP(自然語言處理)等前沿科研領域佈局多年,這話沒人反駁吧?
阿里達摩院在2018年底啓動研發,在超大模型、語言及多模態能力和訓練、平台化服務、落地應用等多個方面,為中文大模型的發展做了一些前沿性、引領性的工作。
- 2019年
發佈大規模預訓練語言模型structBERT並登頂全球NLP權威榜單GLUE;
- 2021年
先後發佈國內首個超百億參數的多模態大模型M6及語言大模型PLUG;
- 2021年8月
阿里大模型在全球機器視覺問答榜單VQA上首超人類得分;
- 2021年10月
阿里探索較低能耗訓練全球首個10萬億參數大模型M6;
- 2022年2月
M6可同時完成10餘項單模態及多模態任務。
這些非技術背景的讀者看上去意義不大的事情,如今都成了大模型的“史料”。
阿里大模型的品牌統一在“通義”之內,那些曾經被我來回理解的大模型都有了一個共同的名字。
近日,阿里“通義千問”語言大模型邀請測試,阿里成為全球較早研發並開放GPT-like大模型的科技公司之一。
譚老師我的大模型技術啓蒙是阿里巴巴給的。
跟着阿里學習大模型這些年,我獲得一個測試邀請碼不過分吧?
所以,通義千問測(翻)試(車),我們放在文章最後。
整體來看,阿里在大模型領域與引領者OpenAI尚有差距。但總體來説,阿里處於全球領先的大模型研發梯隊,具備語言大模型、多模態大模型、大模型底層訓練平台的完整佈局。
應當承認,OpenAI已是全球大模型的引領者,ChatGPT是非常優秀的模式,GPT-4在推理、數學等方面有了非常不錯的表現,是當前通義千問尚不能及的。
通義千問目前在效果上與ChatGPT還存在一定差距,仍在學習和成長。當然,通義千問也有自己較為擅長的領域,比如在文本對話、閲讀理解等方面。
好消息是,阿里應該比譚老師我更理解為何重視大模型。
就算全中國只有三個公司出手大模型,其中一個必須是阿里巴巴。
再來談談大模型走向ToB市場的抓手,即OpenAI公司的Plugin插件。
Plugin既是產品,也是方法,切不可小瞧。
Plugin插件可以成為大模型的“眼睛和耳朵”,使它們能夠接受“再訓練”,而不僅僅依靠原有訓練中的信息。
Plugin插件對於企業拿“再訓練”用好大模型這件事情起到重要作用。
有Plugin,才會有專屬模型未來的方向。
相信未來也不會只是Plugin插件的形式,大模型製造者會摸索出更好的方法。
企業通過Plugin接入GPT後,生產力會有新的提升。
比如在金融、能源或藥品企業裏,再英明神武的企業領導也需要充分的信息才能做決策,企業級大模型應用肯定要結合企業業務數據。
大模型是能力,在大模型能力技術上,企業用數據再次訓練更為重要。
不僅如此,想象大膽一些,加上機器腿和機器手,做控制和執行。
聊到機器人了。
首批熱心極客開發者已將ChatGPT接入機器人。
機器人除了聽從指揮做指定動作,還能提醒你:“你的妻子永遠都是對的。”
沒辦法,語言能力強。用強化學習根據人的反饋數據又訓練過幾輪的效果就是好,機器人的智商情商顯得很不一樣。
批量使用工業機器人的企業通過Plugin接入GPT後,生產力會有新的提升。
我們正處於一個非常漫長的旅程的起步階段,企業級的大模型應用還如星星之火。
Plugin模式一定會被國內大模型競爭者復現。但請回到第一步,你得有個好用的大模型。
動輒超千億參數的大模型研發,不是單一的算法問題,也不是靠堆積GPU實現,這是系統性工程,包括底層算力、網絡、存儲、大數據、AI框架、AI模型等。
AI+雲計算的全棧技術能力是雲廠商制勝大模型的底氣。
再看阿里,全球少數在全棧技術能力都有深度佈局、長久積累的科技公司之一,也是為數不多擁有超萬億參數大模型研發經驗的企業。
前幾天看到國內大模型競爭者們已被劃分出了派別,也不乏有人從零起步。
獨立大模型創業公司估值在2500萬美金之後,要靠業務評估估值,價格都這麼貴了,投資人也很審慎。
大模型“雲上經濟”的權力遊戲般的奇幻史詩揭幕,等待更強的人工智能降臨。
別忘了,比奪取權杖更重要的是人類命運永續。
(完)

更多閲讀
AI框架系列:
3.搞 AI 框架那幫人(三):狂熱的 AlphaFold 和沉默的中國科學家
4.搞 AI 框架那幫人(四):AI 框架前傳,大數據系統往事
注:(三)和(四)現在並未公開發表,將會以圖書出版的形式與各位見面。
漫畫系列
4. AI for Science這事,到底“科學不科學”?
5. 想幫數學家,AI算老幾?
11. 強化學習:人工智能下象棋,走一步,能看幾步?
14. 雲計算Serverless:一支穿雲箭,千軍萬馬來相見
15. 數據中心網絡:數據還有5納秒抵達戰場
16. 數據中心網絡“卷”AI:遲到不可怕,可怕的是別人都沒遲到
AI大模型與ChatGPT系列:
17. ChatGPT大火,如何成立一家AIGC公司,然後搞錢?
18. ChatGPT:絕不欺負文科生
20. 獨家丨從大神Alex Smola與李沐離職AWS創業融資順利,回看ChatGPT大模型時代“底層武器”演進
21. 獨家丨前美團聯合創始人王慧文“正在收購”國產AI框架OneFlow,光年之外慾添新大將
23. “重塑商湯研發體系”“動員整個公司”,我和商湯首席科學家王曉剛聊AI大模型
DPU芯片系列:
2. 永遠不要投資DPU?
長文系列:

最後,再介紹一下主編自己吧,
我是譚婧,科技和科普題材作者。
為了在時代中發現故事,
我圍追科技大神,堵截科技公司。
偶爾寫小説,畫漫畫。
生命短暫,不走捷徑。
原創不易,多謝轉發
還想看我的文章,就關注“親愛的數據”。
