李彥宏這番話，再度掀起大模型開源閉源之爭？

吕栋[email protected]

2024-07-05

【文/觀察者網呂棟】

“2023年國內出現了百模大戰，造成了社會資源的巨大浪費，尤其是算力的浪費，但是也使得我們追趕世界上最先進的基礎模型的能力得到了建立。”7月4日，百度創始人、董事長兼首席執行官李彥宏在2024世界人工智能大會（WAIC）主論壇上説道。

演講中，李彥宏再度提及開源與閉源大模型，並稱開源大模型在學術研究、教學領域等特定場景下有存在的價值，但並不適用於大多數應用場景。“當你處在激烈競爭的環境中，需要讓業務效率比同行更高、成本比同行更低，這時，商業化的閉源模型是最能打的。”

他這番論述，也再次將大模型開源閉源的路線之爭擺上了枱面。但當前從技術層面來看，大模型開源好還是閉源好，其實並沒有定論。唯一能確定的是，不同觀點背後基本都是由各自的商業利益驅使。

2024世界人工智能大會現場圖源：觀察者網

大模型開源好還是閉源好？

今年以來，開源和閉源模型持續成為爭議性話題，甚至引發了大模型公司之間的論戰。

李彥宏在會上直言，“有些外行”甚至混淆了模型開源和代碼開源的概念，“模型開源只能拿到一堆參數，還要在做SFT（監督微調）、安全對齊，即使是拿到對應源代碼，也不知道是用了多少比例、什麼比例的數據去訓練這些參數，無法做到眾人拾柴火焰高，拿到這些東西，並不能讓你站在巨人的肩膀上迭代開發。”

他認為，同樣參數規模下，開源模型能力不如閉源。“如果開源想能力追平閉源，它需要有更大的參數規模，這意味着推理成本更高、反應速度更慢。很多人拿開源模型做改款，以為這樣可以更好地服務自己的個性化需求，殊不知這就變成一個孤本模型，既無法從基礎模型的持續升級中獲益，也沒辦法跟別人共享算力。”

這些觀點，再度展現出李彥宏對閉源大模型的力挺，但行業對此並不是一呼百應，甚至提出了反對意見。

百度集團董事長李彥宏

去年底，阿里雲首席技術官（CTO）周靖人表示，只有真正從心底去擁抱開放的生態，去促進開發者社區的發展，才能將我們的技術融入到各行各業，最終幫助整個核心技術的突破和創新。今天AI的發展，一定不是由一家公司完成的。不管誰有最強的模型，如果沒有開放的技術和經驗，是無法在各項應用場景中落地的。

今年4月在李彥宏提出“開源模型會越來越落後”之後，360集團董事長周鴻禕也公開表示反對。“開源不如閉源好？”他直言，如果沒有開源文化，就不會有Linux、PHP、MySQL等眾多重要的技術成果，甚至互聯網的發展也會受到極大的限制。在他看來，開源不僅推動了技術的發展，更是促進了整個產業的繁榮。

當前如果單純在技術層面看，閉源大模型在能力上確實處於領先地位，諸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是閉源。國內的情況也類似，華為盤古、百度文心一言、字節跳動雲雀，以及月之暗面Kimi等有一定知名度的大模型，目前也基本走的都是閉源路線。

在此背景下，大模型開源好還是閉源好可能很難在行業中形成共識。而從另一個角度來看，大模型開源或閉源，可能更多是在應用場景上的分化，各家的站隊也都有切身利益的考量。對整個大模型行業來説，廠商之間的唱反調，主要是着眼於自身業務發展的緊迫性，所作出的公開表態。

例如周鴻禕支持開源模型的原因可能就很簡單，畢竟在如今的“百模大戰”裏，360相比頭部幾家還處於追趕者的地位，在用户規模和對業界影響力上，都遜色於文心一言、通義千問等大模型。而縱觀軟件行業的發展史，商業公司通過開源來獲得某一賽道的領先地位，並不是沒有先例可循。

2024世界人工智能大會現場圖源：觀察者網

與此同時，在一部分行業人士看來，開源閉源並不應該對立。

百川智能CEO王小川表示，開源和閉源並不像手機中的iOS或者安卓系統只能二選一，從tob角度開源閉源都需要。他預計，未來80%的企業會用到開源大模型，因為閉源沒辦法對產品做更好的適配，或者成本特別高，閉源可以給剩下的20%提供服務。二者不是競爭關係，而是在不同產品中互補的關係。

甚至李彥宏在這次大會上也坦承，開源模型在某些場景下是有價值的，“比如説一些學術研究，或者在教學領域，大家想要研究大模型的工作機制，形成理論，這個時候可能是有價值的，因為大家也經常聽到，我們覺得大模型能力很強，但是不知道為什麼能力強，因為背後沒有理論來支持它，所以研究這個東西，用開源的我覺得沒問題。”

沒有應用，開源閉源都一文不值

儘管行業玩家對開源閉源的話題各執一詞，但在李彥宏看來“這些都不是最重要的”。

“沒有應用，光有基礎模型，不管是開源還是閉源都一文不值。”他在會上直言，“很多人仍然把主要的關注點放在基礎模型上，一天到晚就是跑分，刷榜，誰誰誰又超越GPT4了，OpenAI又出來Sora了，又出來GPT4o了等等。今天這個震撼發佈，明天那個史詩級更新，但是我要問，應用在哪裏？誰從中獲益了？”

就像一直力挺閉源大模型一樣，“不卷模型卷應用”，也是李彥宏老生常談的觀點。

早在一年前，他就曾公開表示，“新的國際競爭戰略關鍵點，不是一個國家有多少個大模型，而是你的大模型上有多少原生的AI應用，這些應用在多大程度上提升了生產效率。”

“大模型本身並不直接創造價值，基於大模型開發出來的AI應用才能滿足真實的市場需求。這是我們百度根據過去一年的實踐，踩了無數的坑，交了高昂的學費換來的。”李彥宏今年4月重申。

2024世界人工智能大會現場百度展台圖源：觀察者網

從整個行業角度看，重視大模型的應用落地並沒有錯，但呼籲大家別再卷模型，則一定程度上反映了李彥宏對百度自身商業利益的考量，或者説是私心。

作為國內大模型行業的先行者，百度顯然更想早日建立自己主導的大模型生態，並以文心一言為支點進行平台化落地。如此一來，百度肯定希望基礎大模型賽道的參與者越少越好，一旦創業者都去開發AI應用而非大模型，百度的AI生態可能會更快建立起來，進而快速產生回報。

但從資本市場表現來看，AI先發優勢始終在百度股價中沒有得到體現。在去年2月觸及161億美元/股後，百度美股出現了持續的震盪下跌，目前跌至了90美元/股，這或許與投資者對百度的業績預期有關。

摩根大通認為這是市場忽略了“生成式AI將成為百度中長期增長動力的假設”。從這個角度看，百度只有加快AI原生應用的落地步伐，在閉源大模型上走出一條賺錢路徑，才能真正兑現業績和市場預期。

由此也就不難理解，李彥宏為何一直呼籲大家別卷模型，持續為應用落地奔走呼號。

2024世界人工智能大會現場圖源：觀察者網

“應用其實離我們並不遙遠。”

他在這次大會提及，隨着基礎模型的日益強大，開發應用也越來越簡單了，“最簡單的就是智能體，這也是我們最看好的AI應用的發展方向。製作一個好的智能體通常並不需要編碼，只要用人話把智能體的工作流説清楚，再配上專有的知識庫，一般就是一個很有價值的智能體了。這比互聯網時代製作一個網頁還要簡單。”

李彥宏透露，基於基礎模型的應用在各行各業和各個領域已開始逐步滲透。兩個月之前，百度曾宣佈文心大模型日調用量超過2億，近期該調用量已超過5億。“僅僅兩個月，調用量發生這麼大的變化，足見它背後代表了真實的需求，是有人在用、有人真的從大模型中獲益了，得到了價值。”

不同時間的相似論述背後，可以看出李彥宏對大模型應用落地有些着急，但着急的肯定也不只是李彥宏和百度，還有騰訊、阿里、商湯科技、科大訊飛等等都在投入大模型的中國廠商。在大模型第一輪的喧囂過去，各界開始理性看待大模型的發展後，如何把高投入變成高增長，成為市場對各大廠商的靈魂拷問。

這次演講結尾，李彥宏還談及了AI是否會替代人類工作的經典話題。

他坦言，AI目前更多是扮演Copilot的角色輔助人工作，而不是替代人，現在已經產生了一些全新的工作機會，如數據標註師、提示詞工程師等。他強調，AI永遠只是工具，不是人類的競爭對手，“我們構建和應用人工智能技術，是為了滿足人的需求、增強人的能力，讓人類的生活更美好。”

本文系觀察者網獨家稿件，未經授權，不得轉載。