大模型走到下半場,真正的“卷點”應該在哪?_風聞
陆玖商业评论-真相只能揭露,无法接近。1小时前
一方面,讓普通人以更小的成本,去了解和使用大模型和AI應用;另一方面,企業也能在不斷的AI應用中,瞭解模型使用的具體場景,以及能帶來的實際價值。

自2022年底大語言模型面世以來,全球範圍內便掀起了新一輪AI浪潮,有的甚至最快是“以周為單位”進行產品迭代。
根據一些公開資料,截至去年10月,國內發佈的大模型就已超過230個,而6月份的時候這一數字還不到80個,短短4個月的時間就翻了近三倍。“百模趕考”實至名歸。
然而行業走到今天,有不少從業者發現,大模型的終點並不在數量的多少,諸如“我們真的需要這麼多模型嗎”“模型之間卷規模到底有沒有用”“那真正的卷點應該被設定在哪”等這般話題,正被業內反覆討論。
產生這種質疑之聲的原因,其實不難理解。畢竟放眼於應用層,除了基於開源大模型不斷調優的“套殼應用”,真正稱得上“能幹”的應用,卻是鳳毛麟角。
這也正如百度創始人李彥宏在上海世界人工智能大會上所説的,“AI時代,‘超級能幹’的應用比只看DAU的‘超級應用’更重要。”換言之,在廣泛的、實際的場景中,企業真正需要的是超級能幹的應用,有能力去解決實際問題,而不只是一個看似很大的超級應用。
隨着大模型“卷應用”的浪潮逐步在金融、交通、政務等領域落地開花,更多的人開始意識到,生成式AI的下半場,或許更大的機會在應用上。而中國的AI產業,有望從應用層實現彎道超車。
警惕“超級APP陷阱”
從PC時代到移動互聯時代,互聯網產品的形態與發展路徑,是截然不同的。
近二十年前,受限於通信技術與硬件水平,軟件產品的容量不可能做得太大,承載信息的能力自然也有限。
隨着硬件算力和通信技術的發達,智能手機作為應用終端,開始成為信息集散地。在這個時代成長起來的互聯網大廠,無一不靠大DAU,大用户量的“超級APP”,觸及用户生活的方方面面。也據此完成了“前AI時代”的資本積累。
當互聯網走入生成式AI時代,以往“一個超級APP”走天下的邏輯,是否還能通用?但如今,這也變成了一個值得商榷的問題。
畢竟此前幾乎無人可以預見,在人工智能時代,用户最常用的AI功能是什麼。到目前為止,C端用户最常使用的AI功能,多用於文檔解析、初級文案生成,文生圖、文生視頻雖然在商業領域已經有初步引用,但水平依舊無法在短時間取代專業人士。
基於同樣的原因,雖然底層模型已經初步產生馬太效應,資源和商業效益開始向頭部大廠聚集,但像移動互聯網時代超過1億日活的“現象級應用”,卻尚未誕生。其中一個原因,是大語言模型的所有能力,尚未被應用層開發者挖掘完畢。
與之相對的是,除了少數行業人士,市場對於生成式AI應用的認知和關注點,更多落在基礎模型的進展上。而李彥宏和百度,則更多希望通過站位未來,來調控這艘大船今天的業務方向。
相較於移動互聯網時代動輒比拼DAU規模,李彥宏認為,不同時代下,應用的發展路徑和模式都是不一樣的。避免掉入“超級應用陷阱”,不要用移動時代的思維看問題,這是其在本次大會上給出的一個結論。
在他看來,AI時代下,“超級能幹”的應用遠比只看DAU的“超級應用”,來得更加重要。“只要對產業、對應用場景能產生大的增益,整體的價值就比移動互聯網要大多了。”李彥宏如是説。
仔細想來,其實這並不難理解。
眼下及未來很長一段時間裏,如果再像移動互聯網時代那般,把絕大多數精力放在底層模型,一來,不斷地重複開發基礎大模型,也是對社會資源的極大浪費;二來,也是更重要的是,這或將錯失更大的機會,特別是錨定產業價值層面的機會。
卷模型與卷應用,從來不是二選一
在人們討論AI大模型數量過多的時候,伴生而來還會注意到另一個現象:數百個大模型問世,這些大模型之間的差異性到底體現在哪兒?而僅從國內生成式AI的競爭演變,就能看出這個情況——
過去一年多,無論是模型層還是應用層,都出現了從“百模大戰”到“補貼大戰”的轉變,起碼在底層模型層,行業已經出現相對飽和;另一方面,行業出清的跡象已經產生。以文心一言為代表的世界領先水平的一批國產大模型已經出現。
從過往連篇累牘的報道中也能發現,從無到有訓練一個底層大模型,數億乃至數十億的資本投入、一卡難求的算力投入、可遇而不可求的AI細分行業人才,只是萬里長征第一步。後續的模型迭代、生態培養等成本,遠非中小AI團隊可以承擔。
正因如此,對於行業的大多數人來説,除非是成規模的大廠,抑或是拿到“龍傲天”劇本的明日之星,卷模型都是一個“無底洞”。無論是積累用户,抑或是解決實際場景下的實際問題,都是應用層的機會更大。
而在這個過程中,行業大模型有關開源、閉源誰更具有優勢的爭辯,一直未曾停止。
支持開源的行業人士認為,開源模型的意義,在於所有團隊都站在一個起跑線上,拿着同樣的廚具和食材,能炒出什麼樣的菜,各憑本事,這是一種公平競爭。
但大模型的開源,或許與一般意義上的軟件開源,存在根本上的差異。譬如一般軟件開源時,開發者可以獲取軟件的源代碼,並據此修改或者增加新功能。
大模型內部代碼,則分為預訓練代碼、微調代碼和推理代碼三層,對於微調代碼,市場上已有很多公開方法。而大模型要被用起來,需要推理代碼,至於訓練過程和數據集,往往也是大模型廠商的核心所在。此外還有算力層面的考量。
在這種背景下,擁有經驗證商業模式的閉源模型,更適合在競爭激烈的大模型行業裏聚集人才和算力,進而實現商業化落地。這也是李彥宏的判斷。
儘管在大會上,他並未否定開源在某些環境中的使用價值,但他也提到,“當你處在一個激烈競爭的市場環境當中的時候,你需要是讓自己業務的效率比你的同行更高,成本比你的同行更低,這個時候商業化的閉源模型是最能打的。”
當然更值得強調的是,“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值。所以,我從去年下半年就開始講大家不要卷模型了,要去卷應用。”
李彥宏透露,在更通用的領域當中,比如説代碼生成,像文心快碼這樣的軟件,在不同的領域正在逐步的滲透,“而在百度內部,我們有30%左右的代碼,已經用AI生成的,代碼的採用率超過了44%。”
下一個爆發點在哪?
無論是重構的百度文庫,抑或是作為底層模型能力終端的文心一言,都只是生成式AI應用落地的初步形態。在李彥宏看來,智能體是大模型落地最有前景的發展方向,也被認為是最接近AGI的方向。
從具體功能來看,智能體不止有對話能力、還有反思、協作能力。在未來的行業應用上,多個智能體協作,去解決複雜的任務,將是非常前沿的技術趨勢。某種意義上説,這也是“超級能幹”的又一種體現。
“製作一個好的智能體通常並不需要編碼,只要用人話把智能體的工作流説清楚,再配上專有的知識庫,一般就是一個很有價值的智能體了。”隨着基礎模型的日益強大,開發應用也越來越簡單了,智能體也成為李彥宏最看好的AI應用方向之一。
事實上,百度對於智能體的佈局較早。早在去年4月份,基於文心一言的文心智能體已經上線。今年6月,中國工程院朱有勇院士及團隊與百度共同打造的首個農業智能體——“農民院士智能體”正式發佈。
智能體學習朱有勇院士的研究成果以及相關的農業知識之後,農民只需通過簡單的提問,就能得到關於旱地稻種植條件、培育技術、病蟲害防治等實際問題的專業解答。
值得一提的是,在文心智能體的平台上,已經有16萬多名開發者和超5萬家企業入駐,覆蓋了100多個應用場景,智能體生態已然初具規模。
在無數個細分領域,隨着各行各業對於生成式AI的理解不斷加深,基於閉源小模型的智能體,也將為行業增效發揮巨大作用。企業多數重複瑣碎的工作,將會被“超級能幹”的智能體所替代,人類大腦深處的潛能,將會投入到更具創造性的工作中去。
而這,就是“超級能幹”的大模型應用落地的價值內核:一方面,讓普通人以更小的成本,去了解和使用大模型和AI應用;另一方面,企業也能在不斷的AI應用中,瞭解模型使用的具體場景,以及能帶來的實際價值。