文心一言背後,站着中國軟件自強的夢想_風聞
子弹财经-子弹财经官方账号-子弹财经(zidancaijing)03-20 20:06

出品 | 子彈財經
作者 | 李老師
編輯 | 閃電
美編 | 倩倩
審核 | 頌文
不久前在ChatGPT爆火時,有數碼博主説了個段子:“美國高科技公司在搞ChatGPT,而我們的高科技公司在搞外賣與賣菜。”
説者無心,聽者有意,大多數中國互聯網企業似乎一直在消費互聯網的道路上走得太久,忘了在高精尖科技的接續投入。
當年,超級電腦“深藍”可以勉強戰勝國際象棋大師卡斯帕羅夫;後來,阿爾法狗輕鬆戰勝李在石柯潔;不久前在更為複雜的策略性MOBA遊戲DOTA2中,Open AI Five隊已經可以戰勝人類戰隊。
其實當AI拋棄人類時,他們已經打了招呼,只是被我們選擇性忽視了。
1、兵家必爭的大模型,百度去拼了這一次,在生成式AI對世界的顛覆中,我們不能再坐視不理。雖然對於C端用户,ChatGPT目前只是聊天機器人,DALL-E2只是AI圖畫生成器,但在AI領域他們的意義不止表面那麼簡單。
人類擅長分析事物,傳統AI的首要任務就是幫你分析;不過更擅長的是創造事物,如賦詩一首、作歌一曲、撰文一篇,以從社交媒體到遊戲,從廣告到建築,從編程到產品設計,從金融到客服,許多需要人類自發產生內容的行業,都等待着生成式AI的重新創作與落地。
甚至有人設想過,生成式AI將創造工作的邊際成本降至零,產生巨大的勞動生產率和經濟價值,以及相應的市值。
2022年,生成式AI就已經榮膺最有前景的技術預測榜的榜首,進入2023年,大模型成為全球科技競賽兵家必爭之地。所以基於大模型的殺手級的生成式AI產品——ChatGPT出現了。
但中國不能沒有自己的生成式AI產品,因為生成式AI面對中文語境時,會發現從邏輯訓練到知識學習都非常複雜。之前有人測試ChatGPT時發現,由於沒有豐富的中文訓練數據,它有時會胡言亂語,甚至當問題出現一些“彎彎繞”時,ChatGPT並不會拐彎,一“騙”就上當。

或者當ChatGPT脱離一些通用領域來到需要中文知識積累的垂直領域,它也不一定適合,例如有人問它“津”時前鼻音還是後鼻音時,它回答的是錯誤的。

**另外,在生成式AI的背後是大模型的訓練,這才是兵家必爭之地。**因為大模型增強了AI技術的通用性,讓開發者以更低成本、更低門檻,面向場景研發、使用更好的AI模型。其實早在四年前,當百度創新性的開始文心大模型ERNIE 1.0研發時,微軟也向ChatGPT的母公司OpenAI下注了10億美元。
如今,隨着百度新一代大預言文心一言在國內的發佈,圍繞語言模型的競賽顯然已經正式展開。
不過各種大模型距離規模產業應用,併成為產業基座還有一段路要走,未來幾年更是大模型的快速發展窗口期,相關的大模型算法、算力基礎設施、下游B端通用應用軟件和垂直行業領域都有望迎來加速增長。百度知道哪怕不是立刻能用能產生利潤,還是同樣義無反顧地做了。
2、文心一言,上場即是勝利3月16日,百度的GTP類產品文心一言,正式面向公眾放開了測試。
在文心一言的新聞發佈會上,文心一言與人類在文學寫作、邏輯推演等互動都讓我們看到了文心一言的“人有我有”。特別是在一些邏輯推理題中,文心一言能發現使用者出了錯誤的雞兔同籠題目在騙它,還能在使用者改正題目後模仿一個人類的解題思路將這個題目算出來。

**另外,文心一言在中文語境、多模態下的表現,讓我們意識到,其實中國科技企業也可以做到“人有我優”。**在新聞發佈會上,李彥宏讓文心一言解釋一下洛陽紙貴這個成語和成語背後的經濟價值,文心一言都能順利完成,在中文語境下,文心一言還可以通過洛陽紙貴賦詩一首。

在一些中文的倒裝句、口語化測試上,文心一言也能夠get人類想要什麼回答,還不忘提醒一下“直男”送禮物要根據女朋友的需求選。

另外,百度文心一言的優勢在於不僅能夠生成文字,還融合了百度在AI領域的其他能力,例如文心一言的圖片創作能力、以及根據文案自動生成視頻的能力,能夠理解你腦海中的畫面並且做到還原。

所以我們看待文心一言,不僅僅是嚐鮮式互動,更是百度面對全球科技競賽升級,又一次站出來的魄力和決心。
因為類似於文心一言的大語言模型,可不是隨隨便便就能投資得起。對標ChatGPT來看,其總算力消耗約為3640PF-days(即假如每秒計算一千萬億次,需要計算3640天),需要7~8個投資規模30億、算力500P的數據中心才能支撐運行。
而近十年累計研發投入超過1000億元的“馬拉松式投入”,也讓百度具備了先發優勢。
目前,百度擁有多個雲計算可用區、龐大的超算集羣,奠定大模型訓練的基礎設施。另外,百度還在陽泉、徐水、定興三個雲計算中心,特別是陽泉智能雲數據中心僅一期就可承載16萬台服務器,預計整個百度陽泉雲計算中心可承載24萬台服務器。
雖然李彥宏形容大模型訓練是暴力美學,需要有大算力、大數據和大模型,每一次訓練任務都耗資巨大。但面對着文心一言大模型的應用的高併發、高彈性、高精度等不同計算需求,還是用積累做到了遊刃有餘。
當然,李彥宏也坦言在英文語境下,文心一言確實還有不完美,不過百度也在儘早開放測試,希望可以通過人類的反饋,加速文心一言模型的迭代速度和豐富度。
「子彈財經」瞭解到,與傳統AI通過海量無標註數據進行訓練的方式不同,文心一言與ChatGPT均採用的模型微調、強化學習、真實的用户指令等技術邏輯,真人蔘與反饋後,文心一言高效的反饋閉環能幫助大模型不斷去調優迭代,越做越好。
中金互聯網行業首席分析師白洋也預計,隨着文心一言的公眾開放,有望建立起真實的用户調用和模型迭代之間的飛輪,模型將越來越聰明,中國的大語言模型,值得市場給予一些信心與耐心。
回想王堅當年做飛天操作系統,華為當年做鴻蒙,其實都是在沒有完全ready的狀態下上馬,重要的是我們需要有技術覺醒的意識,畢竟科技行業中創新都是九死一生的,這件事讓百度這樣的大企業來做,“生”的幾率更大。可見,文心一言的順利登場,現在即是勝利,哪怕結果還不完美。
3、中國軟件當自強比爾・蓋茨對GPT類產品的讚譽是,這種人工智能技術出現的重大歷史意義,不亞於互聯網和個人電腦的誕生。那麼文心一言的出世,於中國的科技界又意味着什麼?
**從技術上來看,文心一言是百度在模型層面的一次大開拓。**目前行業的共識是,模型層面的不斷更迭,改變了IT技術的技術棧,讓過去的三層分級,變成了芯片層、框架層、模型層和應用層。而從高端芯片崑崙芯,到飛槳深度學習框架,再到文心預訓練大模型,最後到搜索、智能雲、自動駕駛、小度等應用,百度是全球為數不多在四層都有領先性產品(佈局)的人工智能公司。

李彥宏還預言,回望2007年,大家不會想象今天會有抖音、淘寶、微信,在AI時代、大模型時代也會出現這樣現象級的應用,這些應用會是基
於大模型開發的。因此在模型層上,還會帶來三大產業機會。

第一類是新型雲計算公司,其主流商業模式從IaaS變為MaaS(模型即服務),例如多模態大模型大大擴展了AI落地的場景,所以提供的模型是不是好用,成為了未來雲計算公司的競爭奧義。
第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業Konwhow能力,這時調用通用大模型能力,就能為行業客户提供解決方案。
例如之前有不少金融行業人士向「子彈財經」表達了對於大模型能力的期盼,他們期望生成式AI是否可以把程序化交易的門檻降低,帶來客户羣體的爆發性增長?大模型後續可以落地個人金融業務成為銷售助手、投研助手,因為它是一個“通才”。目前,互聯網、媒體、金融、保險、汽車、企業軟件等行業的650家頭部企業,都宣佈加入百度“文心一言”生態。
而第三類是基於大模型底座進行應用開發的公司,即應用服務提供商,隨着文心一言等通用AI產品的技術迭代和成本降低,許多公司都有機會參與到生成式AI的創業中。
更重要的是,在真實世界國家能力博弈中,作為中國企業的百度,在運用大模型吸引國內企業合作時,也能夠避免一些合規性和話語權的問題。
文心一言之所以可以跨越這麼多不同的領域,輔助實現生產效率的提升的基礎,是因為百度的文心大模型已經包括36個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求,構建了業界規模最大的產業大模型體系。未來,它提供的能力或將成為人工智能時代的“石油”,支撐社會運行最底層的“代碼”。
**我們有理由預測,目前文心一言對於大模型的進擊,是讓基礎軟件穩定、不再被卡脖子的縮影。**畢竟軟件及軟件池子裏的數據、框架、模型,包括積累的軟件人才,都是重要的生產資料,沒有這些中國的數字經濟發展就會受阻,而剛剛過去的“兩會”中,國務院機構改革新設了國家數據局,也意味着數字化強國是一定要實現的。
曾幾何時大家聊到大飛機、芯片等卡脖子事項時,都會提到,若我們不能啃下這樣的“硬骨頭”,幾十年後,可能較難在競爭中脱穎而出。
在軟件中亦然,往小了説是關於產業經濟和技術進步,往大了説足以和國家競爭力掛鈎,軟件也是一場我們“不能輸”“輸不起”的戰爭。
《中國人工智能發展報告》中提出:中國在歷次工業革命裏一直處於落後追趕的狀態,而在第四次工業革命興起之際,中國已經和其他國家一起坐在頭班車上。所以,百度堅持文心一言和其他大模型的訓練、行業落地,也是中國軟件自強的另一種堅持。