李開復解讀大型語言模型：兩年內LLM至少還有兩波迭代 | 聯合早報

zaobao

2024-08-20

來源：《遠見》雜誌

作者：曾子軒

“我這個年紀創業（能招募人才），肯定不只是因零一萬物的AI演算法做得比別人好。”説出這句話的，是年過花甲的李開復。當人工智慧掀起巨潮，他卻重回海景第一排逐浪，他究竟看見什麼？

李開復創辦的“零一萬物”，主攻矚目程度最高、競爭也最激烈的大型語言模型（Large Language Model, LLM）。既要對標美國世界級的玩家，也得和中文世界的大廠和新創業者抗衡，不只比拼模型性能，還要在價格上維繫競爭力。

從硬體、基礎建設、開發者工具、應用到模型，生成式AI的每個領域都已烽火連天。李開復如何深度解讀這場大型語言模型之戰？

注入智慧，AI賦能一切應用

自2009年創辦並操盤“創新工場”，李開復在科技創投領域耕耘超過10年。去年3月隱士出山，親自下場籌劃，以基礎模型為題創業，只因他已看見全新機會。

去年接受《遠見》專訪，李開復表示，在生成式AI的帶動之下，軟件應用將能重生、使用者界面出現改變、商業模式更會進化。一年過去，預言逐步成真。

ChatGPT全面進化，已能讀懂圖片和聲音，微軟讓筆電搭載Copilot，蘋果更宣言，將在手機中注入智慧，從裝置到應用，讓時隔一年再度接受《遠見》專訪的李開復樂觀表示，“Super Intelligence”時代已然來臨。

他分析，電腦時代能用“Computer on every desktop”總結，當人們的辦公桌放上電腦，提升生產力的Office便成為殺手級應用。“Anywhere Anytime Computing”則是移動網絡時代的標記，四處遷徙的消費者時刻連網，應用程序能獲取位置資訊，Uber、美團因此帶來價值。

將時間快轉至今，得到AI賦能的應用，不再只是解決疑難雜症，甚至代理人類完成工作。生成式AI與大型語言模型之所以標誌AI 2.0的開展，正是因為AI做為生產要素的成本下降，從專用走向通用，運算不再昂貴，應用就此得到智慧，“你要善用這些應用程序的聰明才智，做過去不方便或不可能做的任務。”

推論成本將是關鍵

不過，雖然生成式AI颳起的旋風未停，但目前獲益最多的，仍是賣鏟子的人。雲端服務商對AI伺服器的需求激增，催動英偉達（Nvidia，又稱輝達）等晶片生產商接滿訂單，效應也外溢到台廠協力廠商，但真正讓消費者有感的應用還在半途，軟體廠商也在尋覓應用場景。

李開復解讀，無論是對企業或者消費者，生成式AI都有市場。前者在企業後勤單位如財務、人力資源領域中，增加員工效率的效益已浮現，幫助消費者完成任務的用法，也在陸續發生。

然而，AI時代和移動時代的巨大差異之一，在於每次大型語言模型運作服務時，皆會產生推論成本。“在移動互聯網時期，都是先獲取大量用户，不收任何費用，待用得開心後，再從他們身上收費。”搜索引擎、社羣網絡和短影音應用，皆遵循此法則。

但AI時代很難靠着補貼式戰法打下江山，因為用户變多，不會帶來規模經濟成本降低的益處。“以前你去燒用户（成本補貼），燒不掉太多什麼，現在每次回答問題，我們都在燒圖像處理器（GPU），最後用户不付費就破產。”無論是和ChatGPT對答，還是以Bing生成圖像，OpenAI與微軟都得在雲端上消耗算力，這也是後者力推AI PC的原因之一。

即便向消費者收費，若費用無法超過獲客成本和推論成本的總和，服務仍無法延續。李開復以近期他提倡的的概念“TC-PMF”（Technology Cost- Product Market Fit）提醒生成式AI創業者，在尋找產品與市場契合程度時，需關照技術成本的變動。

靜態來説，要在模型價格和生成內容品質之間取捨，例如，GPT-4表現優異但所費不貲，GPT-3.5同等模型效果差卻便宜。動態來看，每過九到12個月，基礎模型能力便會顯著升級，例如GPT-3.5至GPT-4的換骨脱胎，以及GPT-4到GPT-4o的化蛹為蝶。

當新模型面世，調用舊等級的模型費用，將下降到原先的十分之一，因此創業者不能只看PMF，而要考慮變動的TC，惟有掌握動態變化，才能生存。

李開復認為，自研基礎模型、搭建AI基礎設施、推出AI優先應用的“三位一體”戰略，是大模型創業者第一時間捕捉到TC-PMF的關鍵，零一萬物目前正在實踐當中。

中美AI競爭各有優勢

有許多人關注科技戰，對中國發展AI帶來負面影響。李開復表示，添購顯卡的問題沒有想像中嚴重，關鍵差異在融資。“美國的創業公司，比中國公司更願意花錢買GPU，理由就是美國市場給這些有能力做大模型的公司，更高的估值。”

這既影響企業發展走向，也影響商業模式。李開復解釋，雖然中國大型語言模型企業算力較少，但人們願意花心思、下苦功，“刻苦耐勞做一些不那麼光鮮耀眼的事情。”例如，調校GPU、修改架構和配合軟體，擠出每張顯卡的最大價值。

李開復分析，美國企業人才頂尖，能開拓出科技最尖端的創新，中國則擅長改善產品、在成本效益間找到甜蜜點。“美國公司做不出拼多多，但是中國公司也做不出Google。”即便大型語言模型領域中國落後半年，但很難説後發一定無法先至。

以大型語言模型企業來看，對比中、美環境，李開復分析，後者在消費者付費意願和客單都高於前者，這讓中國創業者需要在商業模式上下功夫。“因為用户付費習慣不夠多，反而要逼自己找新的商業模式。”例如，當年主打免費的淘寶，便是靠着收取廣告費的另闢蹊徑擊敗eBay。

觀察零一萬物發展，既有面向消費者的應用“萬知”，同時也在中國海外推行企業用服務。萬知背後旗艦模式YI-Large，中文能力足以和GTP-4o相提並論，因此消費者願意埋單，這正是由技術實力撐起；在海外市場拓展也頗有成績，無論是付費意願或者平均客單價都高過中國競業，穩定的SAAS服務，讓零一萬物不用在客製化AI、無法規模化的紅海中，與他人爭搶微薄利潤。

雖然阿里巴巴、百度和科大訊飛等大廠在價格戰中逐底，甚至有部分模型的調取費用壓低至零，但李開復並不擔憂價格戰，甚至正面看待降價情形。不憂慮自家企業，全因零一萬物模型性能優異，在多項國際評測中成績斐然；不擔心整體產業，則是因降價反映技術進展，更代表生成式AI將有機會擴散到更多地方。

他堅定表示，大型語言模型至少還有兩代巨大的模型提升，不只帶動應用發展，同時降低推論成本的定價，未來兩年生成式AI應用將會看到劇烈競爭。

在李開復眼裏，想在大型語言模型競賽做出成績，是最短的時間窗口之內，最有挑戰性的難題。

正如《離騷》中所言，“路漫漫其修遠兮，吾將上下而求索。”一輩子在人工智慧領域打滾，如今重返前線迎難而上，這是李開復的“吾雖艱險，心中樂之”。

李開復簡介

出生：1961年

經歷：曾任蘋果、SGI和微軟等企業高級主管，於微軟工作任內創立微軟中國研究院（微軟亞洲研究院），後至Google擔任全球副總裁與大中華區總裁。2009年創立創投機構創新工場，2023年創辦零一萬物。

榮譽：《時代雜誌》百大全球最具影響力人物、《時代雜誌》全球25大AI領袖

本文出自2024年7月號的《遠見》雜誌。台灣遠見天下文化事業羣將於11月6日至7日，在香格里拉台北遠東國際大飯店舉辦第2024第22屆“華人領袖遠見高峯會”，新加坡《聯合早報》為媒體夥伴。