向下扎到根,向上捅破天,華為闖入AI深水區_風聞
智谷趋势-智谷趋势官方账号-新中产的首席财富顾问。微信500强。昨天 23:14
智谷趨勢(ID:zgtrend) | 王延鶴
華為,底氣十足。
剛剛,華為開發者大會(HDC 2024)召開,華為向世界展現了一種精神:向下扎到根,向上捅破天。下一個破局者,依然是華為。
本次大會,盤古大模型5.0全面升級,將AI紮根到千行百業,解決落地問題;華為雲昇騰AI雲服務,要做好算力底座,破解算力的瓶頸。
華為抓住了AI當前最核心的問題,技術突破、自證價值、真正落地。當人們習慣強調AI炫技或者價格時,華為更強調產業落地創造實際的價值。
過去幾年,華為勇挑大樑,在做底層硬件、算力、AI大模型以及應用生態的全面更新。
如果只看研發資金,華為2023年的投入超1647億元,是唯一研發超過200億美金,能與谷歌、蘋果、微軟和Meta媲美的中國企業。
這種務實精神的背面,是華為的孜孜追求:能否將破局之力,帶入更多領域的科技創新?
01
9.9一杯的奶茶,成本100億的AI大模型,能有什麼共同點?
答:他們都在打價格戰。
過去一個多月,幾乎是AI界的春晚。從OpenAI更新GPT-4o,谷歌I/O大會,微軟的AI PC,英偉達3萬億美金到蘋果公佈Apple Intelligence。各種“顛覆式”“AI時刻”主導了這段時間的科技圈。
而AI大戰的B面,則是價格戰。ChatGPT在去年就推出Enterprise企業版,並且下調B端調用價格吸引客户,對於C端用户也有限免費了GPT-4o。Sam Altman聲稱92%的世界500強公司已在使用ChatGPT。
國內科技界則把價格戰捲到了新地步。幻方DeepSeek、智譜AI先後降價,之後字節跳動將豆包通用模型Pro-32k的輸入價格,直接打到0.0008元/千tokens,號稱比行業均價便宜99.3%;
阿里將9款通義千問模型降價,其中Qwen-Long主力模型降價97%;百度則直接宣佈,將ERNIE Speed和ERNIE Lite兩款模型免費。
這場降價潮裏,是普通用户、開發者和中小企業受益,加速了AI在國內的滲透普及率。但質疑的聲音也被提出:價格戰能否持續?價格戰之外的路,比如模型技術、打造超級應用,誰有差異化競爭優勢?
李開復表示,整個行業每年降低10倍推理成本是可以期待的,瘋狂降價是“雙輸”的打法,技術還是最重要的,如果技術不行,就純粹是貼錢賠錢做生意。
月之暗面創始人楊植麟認為,今天AI在人的工作流中佔比可能只有1%,未來AI在某個節點超過人類,就會產生新的商業模式,不再像今天在B端API調用上打價格戰,而是一個普惠的AI。
“降低模型推理成本並不難,難的是探索模型總和能力的上限。”Minimax創始人閆俊傑表示。
紅杉資本此前發佈了報告《生成式AI的第二幕》,指出兩點:
·由技術驅動的生成式AI第一幕已經落幕;
·市場進入“第二幕”,需要真正直麪人類的問題,回應客户的需求。
這些觀點指向一個現實:AI目前最大的問題,還不是需求或成本,數據也不是壁壘,商業和應用上證明AI的價值更重要。
在席捲業界的大討論裏,華為雲始終保持冷靜。
對賬面資金充裕的華為來説,要打價格戰不要太容易,是很容易就能相出的策略。但什麼是“正確的事,正確地做”?
在HDC 2024,華為給出的答案是降落傘自己先跳,先把事情幹好。
會上,華為常務董事、華為雲CEO張平安發佈盤古大模型5.0,在全系列、多模態、強思維三個方面升級;且展示了盤古大模型應用到自動駕駛、工業設計、具身智能和高鐵、鋼鐵、氣象等落地實踐案例。
此外,華為雲CTO張宇昕、華為諾亞方舟實驗室主任姚駿分別就華為雲全棧系統性創新、盤古大模型5.0技術解密發表主題演講,詳細解讀華為雲在AI領域的全棧創新優勢。
他們要回答最根本的問題:AI到底能做什麼事?行業怎麼才能用上AI?中國發展AI還有哪些堵點,要怎麼打通?
這需要華為在技術創新能向上捅破天,在產業落地上要向下扎到根。
這種極為務實的精神,指導着華為闖入AI的第二幕。
02
盤古大模型所有努力都是朝着一個方向:讓AI真正解難題、做難事,重塑千行萬業。
這既要技術突破瓶頸,也要解決非常實際的落地工程問題。早在盤古大模型3.0發佈時,華為雲就採用完全的分層解耦設計,包括“5+N+X”的三層架構,可以快速適配、快速滿足行業的多變需求。
L0層是包含自然語言、視覺、多模態、預測、科學計算的5個基礎大模型;
L1層是N個行業通用大模型,目前已在政務、製造、金融、礦山、氣象等30多個行業落地;
L2層是更細化的場景模型,比如政務熱線、颱風路徑預測、網點助手等,主打“開箱即用”的應用服務,目前已在400多個場景落地;
盤古大模型此次升級,直接進入5.0時代,正是讓技術真正“創造價值”的。
首先,盤古5.0包括小中大超大杯,4種不同參數規格,可以讓客户根據訴求隨心選擇。
Pangu E(Embeded):十億級參數,可支撐手機、PC等端側的智能應用;
Pangu P(Professional):百億級參數,滿足低時延、低成本的推理需求;
Pangu U(Ultra):千億級參數,成為企業通用大模型的堅實底座;
Pangu S(Super):萬億參數超級大模型,能夠處理跨領域多任務;
同時,盤古5.0重點升級了多模態和強思維兩方面的能力,幫助大模型更好更精準理解我們生活的多模態的物理世界。
從現場演示來看,它在學習了整張清明上河圖後,可以精準回答“趙太丞家有多少個人?”,答,“一共有四個人”。而趙太丞家在原畫裏佔的畫幅還不到200分之一。
清明上河圖答題
多模態升級後,盤古5.0能精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等多種模態。其次,憑藉華為雲首創的可控時空生成技術(STCG),AI能夠真正“看懂”這些信息,並且生成更符合物理規律的多模態內容。
這種能力,可以直接應用到工業製造、自動駕駛、建築等價值場景。
比如,輸入一張衞星遙感圖片,盤古大模型能準確分析這片區域的地理情況,農作物的生長環境,然後預估作物產量,並且給出培育和防病蟲害的建議;再比如通過巨大的病理照片找到我們想要的病菌的數量級,賦能醫學研究。
在思維鏈方面,盤古5.0將思維鏈技術與策略搜索深度結合,極大提升了數學能力、複雜任務規劃能力,以及工具調用能力。思維鏈技術能幫助智能體(如機器人)更好地理解和預測環境變化,“策略搜索"則是智能體用來適應這些變化並做出決策的過程。兩者共同作用,能使智能體能夠在複雜環境中進行有效的學習和決策。
智能體是AI的未來,能夠進行復雜邏輯推理,也是大模型成為行業助手最關鍵的特徵。
在具身智能方面,華為雲現場展示了搭載盤古5.0的樂聚“夸父”機器人。
它可以識別和理解自己所處的環境,並且通過學習和決策,完成10步以上的複雜任務規劃。比如它除了回答問題、打招呼以外,就能理解人類“口渴”的需求,並從現場物品中選出瓶裝水、遞水。
03
中國有很多規模做到世界第一的產業。這背後意味着生產製造的世界工廠,和豐富的消費場景,都是能激發AI、利用AI的對象。
用AI科技革命疊加產業轉型升級,也是目前政府推動新質生產力發展的主要陣地。
在HDC 2024上,華為雲展示了豐富的盤古大模型落地案例,有兩個案例給我印象最深刻。
一個是鋼鐵大模型。
寶武鋼鐵是目前全球規模最大的鋼鐵企業,年鋼產量超1億噸。這個龐然大物要轉型,既是一個AI落地課題,也事關綠色環保、產業升級的進程。
2023年,寶武鋼鐵已經和華為就數字化轉型展開合作,雙方致力於立足鋼鐵行業前沿課題,運用人工智能、大數據工具和方法,形成鋼鐵冶金領域或工業領域大模型。
華為雲方案主要應用在高爐鍊鐵和熱軋鋼帶兩個環節中。
高爐鍊鐵場景被認為是AI落地最難的應用場景,雙方通過用盤古鋼鐵大模型進行高爐爐況預測,指導高爐生產調控,可以大幅提升爐內工況的穩定性。經過實踐發現,每減少10℃的温度波動,每噸鐵水就能減少1kg焦炭消耗,成本降低3塊錢;僅每年高爐爐況的優化,就能讓寶鋼降低10億元的成本。
另一個是華為雲在自動駕駛的應用。
我們知道,自動駕駛的競爭到了關鍵時刻。在自動駕駛訓練裏,最難的是遍歷複雜場景的Corner Case,這要靠車企海量的路測數據,或者在虛擬環境仿真訓練,成本高、耗時長。
這次升級多模態升級後,盤古5.0可以生成像Sora一樣,符合物理規律、真實世界的視頻的。
但華為沒有去做一鏡到底的娛樂視頻,而是把能力投入到行業急需的價值場景,就比如,生成自動駕駛的訓練數據。
盤古大模型能生成車身六個攝像頭視角的視頻,並且能控制行駛環境的天氣、道路、車況,這就解決了自動駕駛的數據難題。
現在車企在競速解鎖高階智駕,華為能否跑到前面,或許要由盤古大模型決定。
作為大模型行業應用的主力軍和排頭兵,政企客户通常業務場景複雜多樣,對數據安全、訓推效率和開發成本都有極致的要求。能夠兼顧安全合規與成本的大模型混合雲,正在成為越來越多企業的優先選擇。在2023年,華為雲就推出業界首個大模型混合雲華為雲Stack。
經過一年實踐,華為雲不斷精進,總結髮布了大模型混合雲十大創新技術,包括多樣性算力調度、雲邊協同、AI-Native存儲、增強AI網絡、算子加速、全鏈路數據工程、統一數據編碼、精細視覺神經網絡、無感斷點續訓、安全護欄,覆蓋從雲基礎設施到AI開發平台以及模型層,致力於解決大模型在政企落地的“最後一公里”,加速政企大模型應用進程。
實際上,行業場景應用之外,AI手機、AI PC等終端也是目前人工智能應用規模最大的場景。
華為的盤古大模型,也堅持“自己的降落傘自己先跳”,把華為的雲服務、手機、汽車、操作系統等業務都改造一遍。
去年12月,問界M9發佈,車載的智能助手小藝已經接入盤古大模型;今年4月,餘承東也宣佈MateBook X Pro應用盤古,打造AI PC;目前華為手機,已經升級了AI拍照增強、AIGC生成、雲助小藝的功能。
這些提升,是C端消費用户能直接體驗到的。隨着HarmonyOS NEXT的到來,華為終端和華為雲盤古大模型的融合,還將繼續深化。
04
算力是AI時代的核心驅動力。
英偉達成為全球市值第一後,黃仁勳脱下黑色皮衣,跑去加州理工的畢業生做演講。
他引用諾獎物理得主理查德·費曼的名言,和流行天后Taylor Swift的梗:
“世界是不確定的,是不公平的,你可能拿到的是一張爛牌,那你該shake it off。總會有其他機遇,或者,創造你自己的機遇。”
AI創造遍地機遇的新世界,但算力供應已經緊張。
微軟、亞馬遜、Meta等企業,都有萬張H100級的算力集羣。
微軟宣佈,每年要花500億美金建數據中心;Meta計劃再買35萬張H100,到今年底可能累計有60萬規模;馬斯克也準備了百億美金,買英偉達更先進的B100和B200。
英偉達銷量
然而,英偉達的先進GPU,哪怕是“閹割版”的A800/H800,中國企業也很難再獲取。
據報道,英偉達最新中國特供版的H20,算力只有H100的15%,性價比已經不夠誘人。
國內除了阿里、百度、騰訊、字節跳動少數互聯網公司,其他中廠和明星AI創業公司,都沒有萬卡級A100/H100的算力儲備,依賴頭部雲廠商的算力投資和合作。
這造成國內算力捉襟見肘。普通用户也能感知到高峯時段明顯的等待和卡頓,而大企業用户的採購需求也很難滿足。
當算力受限時,我們又要如何創新,創造機遇呢?
華為的答案是,以昇騰AI雲服務提供即開即用的澎湃算力。
前兩天6月14日,華為雲的華東(蕪湖)數據中心正式開服。這標誌着,華為雲的貴州貴陽、內蒙古烏蘭察布、安徽蕪湖、香港的4大AI雲算力中心佈局已經成型。
通過AI算力一張網,供應全國長三角、大灣區、京津冀等地的需求,也為中國出海企業提供堅實可靠的支撐。企業不用再為自己買卡和自建數據中心焦慮,能從華為雲買到即開即用的算力。
去年9月,任正非提出,我們即將進入第四次工業革命,基礎就是大算力。華為CFO孟晚舟説,要致力於打造中國堅實的算力底座,為世界構建第二選擇。
如今,華為雲在不斷兑現自己的承諾。昇騰AI雲服務,就是專門提供AI算力,一個從硬件、基礎設施、算力集羣、架構到軟件應用,華為全棧自研的生態。
除了自主可靠外,昇騰AI雲服務在穩定性上也有競爭優勢。業界萬億參數模型訓練的平均無中斷時長約2.8天,昇騰能做到40天穩定無中斷;業界平均集羣故障恢復時間約60分鐘,昇騰AI雲服務可以縮短到10分鐘。
在兼容性上,已全面適配行業主流的100多個大模型,服務600多家企業客户,以雲服務的方式協助客户開發,訓練,託管和應用模型,支撐了國內像大模型訓練、自動駕駛研發、智慧城市等高算力需求的開發項目。
華為在尋找一條破局之路。
它打破算力的束縛,成為一貫在做的“黑土地”,支撐模型研發、AI應用的誕生,讓千行萬業放開手腳去轉型升級;另一邊推動AI大模型,從技術突破到產業落地,從理論前沿到最後一公里的突破。
華為在給世界構建第二選擇,也是在讓中國AI往前的底氣。