李彥宏這番話,再度掀起大模型開源閉源之爭?

【文/觀察者網 呂棟】
“2023年國內出現了百模大戰,造成了社會資源的巨大浪費,尤其是算力的浪費,但是也使得我們追趕世界上最先進的基礎模型的能力得到了建立。”7月4日,百度創始人、董事長兼首席執行官李彥宏在2024世界人工智能大會(WAIC)主論壇上説道。
演講中,李彥宏再度提及開源與閉源大模型,並稱開源大模型在學術研究、教學領域等特定場景下有存在的價值,但並不適用於大多數應用場景。“當你處在激烈競爭的環境中,需要讓業務效率比同行更高、成本比同行更低,這時,商業化的閉源模型是最能打的。”
他這番論述,也再次將大模型開源閉源的路線之爭擺上了枱面。但當前從技術層面來看,大模型開源好還是閉源好,其實並沒有定論。唯一能確定的是,不同觀點背後基本都是由各自的商業利益驅使。

2024世界人工智能大會現場 圖源:觀察者網
大模型開源好還是閉源好?
今年以來,開源和閉源模型持續成為爭議性話題,甚至引發了大模型公司之間的論戰。
李彥宏在會上直言,“有些外行”甚至混淆了模型開源和代碼開源的概念,“模型開源只能拿到一堆參數,還要在做SFT(監督微調)、安全對齊,即使是拿到對應源代碼,也不知道是用了多少比例、什麼比例的數據去訓練這些參數,無法做到眾人拾柴火焰高,拿到這些東西,並不能讓你站在巨人的肩膀上迭代開發。”
他認為,同樣參數規模下,開源模型能力不如閉源。“如果開源想能力追平閉源,它需要有更大的參數規模,這意味着推理成本更高、反應速度更慢。很多人拿開源模型做改款,以為這樣可以更好地服務自己的個性化需求,殊不知這就變成一個孤本模型,既無法從基礎模型的持續升級中獲益,也沒辦法跟別人共享算力。”
這些觀點,再度展現出李彥宏對閉源大模型的力挺,但行業對此並不是一呼百應,甚至提出了反對意見。

百度集團董事長李彥宏
去年底,阿里雲首席技術官(CTO)周靖人表示,只有真正從心底去擁抱開放的生態,去促進開發者社區的發展,才能將我們的技術融入到各行各業,最終幫助整個核心技術的突破和創新。今天AI的發展,一定不是由一家公司完成的。不管誰有最強的模型,如果沒有開放的技術和經驗,是無法在各項應用場景中落地的。
今年4月在李彥宏提出“開源模型會越來越落後”之後,360集團董事長周鴻禕也公開表示反對。“開源不如閉源好?”他直言,如果沒有開源文化,就不會有Linux、PHP、MySQL等眾多重要的技術成果,甚至互聯網的發展也會受到極大的限制。在他看來,開源不僅推動了技術的發展,更是促進了整個產業的繁榮。
當前如果單純在技術層面看,閉源大模型在能力上確實處於領先地位,諸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是閉源。國內的情況也類似,華為盤古、百度文心一言、字節跳動雲雀,以及月之暗面Kimi等有一定知名度的大模型,目前也基本走的都是閉源路線。
在此背景下,大模型開源好還是閉源好可能很難在行業中形成共識。而從另一個角度來看,大模型開源或閉源,可能更多是在應用場景上的分化,各家的站隊也都有切身利益的考量。對整個大模型行業來説,廠商之間的唱反調,主要是着眼於自身業務發展的緊迫性,所作出的公開表態。
例如周鴻禕支持開源模型的原因可能就很簡單,畢竟在如今的“百模大戰”裏,360相比頭部幾家還處於追趕者的地位,在用户規模和對業界影響力上,都遜色於文心一言、通義千問等大模型。而縱觀軟件行業的發展史,商業公司通過開源來獲得某一賽道的領先地位,並不是沒有先例可循。

2024世界人工智能大會現場 圖源:觀察者網
與此同時,在一部分行業人士看來,開源閉源並不應該對立。
百川智能CEO王小川表示,開源和閉源並不像手機中的iOS或者安卓系統只能二選一,從tob角度開源閉源都需要。他預計,未來80%的企業會用到開源大模型,因為閉源沒辦法對產品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務。二者不是競爭關係,而是在不同產品中互補的關係。
甚至李彥宏在這次大會上也坦承,開源模型在某些場景下是有價值的,“比如説一些學術研究,或者在教學領域,大家想要研究大模型的工作機制,形成理論,這個時候可能是有價值的,因為大家也經常聽到,我們覺得大模型能力很強,但是不知道為什麼能力強,因為背後沒有理論來支持它,所以研究這個東西,用開源的我覺得沒問題。”
沒有應用,開源閉源都一文不值
儘管行業玩家對開源閉源的話題各執一詞,但在李彥宏看來“這些都不是最重要的”。
“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值。”他在會上直言,“很多人仍然把主要的關注點放在基礎模型上,一天到晚就是跑分,刷榜,誰誰誰又超越GPT4了,OpenAI又出來Sora了,又出來GPT4o了等等。今天這個震撼發佈,明天那個史詩級更新,但是我要問,應用在哪裏?誰從中獲益了?”
就像一直力挺閉源大模型一樣,“不卷模型卷應用”,也是李彥宏老生常談的觀點。
早在一年前,他就曾公開表示,“新的國際競爭戰略關鍵點,不是一個國家有多少個大模型,而是你的大模型上有多少原生的AI應用,這些應用在多大程度上提升了生產效率。”
“大模型本身並不直接創造價值,基於大模型開發出來的AI應用才能滿足真實的市場需求。這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”李彥宏今年4月重申。

2024世界人工智能大會現場百度展台 圖源:觀察者網
從整個行業角度看,重視大模型的應用落地並沒有錯,但呼籲大家別再卷模型,則一定程度上反映了李彥宏對百度自身商業利益的考量,或者説是私心。
作為國內大模型行業的先行者,百度顯然更想早日建立自己主導的大模型生態,並以文心一言為支點進行平台化落地。如此一來,百度肯定希望基礎大模型賽道的參與者越少越好,一旦創業者都去開發AI應用而非大模型,百度的AI生態可能會更快建立起來,進而快速產生回報。
但從資本市場表現來看,AI先發優勢始終在百度股價中沒有得到體現。在去年2月觸及161億美元/股後,百度美股出現了持續的震盪下跌,目前跌至了90美元/股,這或許與投資者對百度的業績預期有關。
摩根大通認為這是市場忽略了“生成式AI將成為百度中長期增長動力的假設”。從這個角度看,百度只有加快AI原生應用的落地步伐,在閉源大模型上走出一條賺錢路徑,才能真正兑現業績和市場預期。
由此也就不難理解,李彥宏為何一直呼籲大家別卷模型,持續為應用落地奔走呼號。

2024世界人工智能大會現場 圖源:觀察者網
“應用其實離我們並不遙遠。”
他在這次大會提及,隨着基礎模型的日益強大,開發應用也越來越簡單了,“最簡單的就是智能體,這也是我們最看好的AI應用的發展方向。製作一個好的智能體通常並不需要編碼,只要用人話把智能體的工作流説清楚,再配上專有的知識庫,一般就是一個很有價值的智能體了。這比互聯網時代製作一個網頁還要簡單。”
李彥宏透露,基於基礎模型的應用在各行各業和各個領域已開始逐步滲透。兩個月之前,百度曾宣佈文心大模型日調用量超過2億,近期該調用量已超過5億。“僅僅兩個月,調用量發生這麼大的變化,足見它背後代表了真實的需求,是有人在用、有人真的從大模型中獲益了,得到了價值。”
不同時間的相似論述背後,可以看出李彥宏對大模型應用落地有些着急,但着急的肯定也不只是李彥宏和百度,還有騰訊、阿里、商湯科技、科大訊飛等等都在投入大模型的中國廠商。在大模型第一輪的喧囂過去,各界開始理性看待大模型的發展後,如何把高投入變成高增長,成為市場對各大廠商的靈魂拷問。
這次演講結尾,李彥宏還談及了AI是否會替代人類工作的經典話題。
他坦言,AI目前更多是扮演Copilot的角色輔助人工作,而不是替代人,現在已經產生了一些全新的工作機會,如數據標註師、提示詞工程師等。他強調,AI永遠只是工具,不是人類的競爭對手,“我們構建和應用人工智能技術,是為了滿足人的需求、增強人的能力,讓人類的生活更美好。”
本文系觀察者網獨家稿件,未經授權,不得轉載。