李開復解讀大型語言模型:兩年內LLM至少還有兩波迭代 | 聯合早報
zaobao
來源:《遠見》雜誌
作者:曾子軒
“我這個年紀創業(能招募人才),肯定不只是因零一萬物的AI演算法做得比別人好。”説出這句話的,是年過花甲的李開復。當人工智慧掀起巨潮,他卻重回海景第一排逐浪,他究竟看見什麼?
李開復創辦的“零一萬物”,主攻矚目程度最高、競爭也最激烈的大型語言模型(Large Language Model, LLM)。既要對標美國世界級的玩家,也得和中文世界的大廠和新創業者抗衡,不只比拼模型性能,還要在價格上維繫競爭力。
從硬體、基礎建設、開發者工具、應用到模型,生成式AI的每個領域都已烽火連天。李開復如何深度解讀這場大型語言模型之戰?
注入智慧,AI賦能一切應用
自2009年創辦並操盤“創新工場”,李開復在科技創投領域耕耘超過10年。去年3月隱士出山,親自下場籌劃,以基礎模型為題創業,只因他已看見全新機會。
去年接受《遠見》專訪,李開復表示,在生成式AI的帶動之下,軟件應用將能重生、使用者界面出現改變、商業模式更會進化。一年過去,預言逐步成真。
ChatGPT全面進化,已能讀懂圖片和聲音,微軟讓筆電搭載Copilot,蘋果更宣言,將在手機中注入智慧,從裝置到應用,讓時隔一年再度接受《遠見》專訪的李開復樂觀表示,“Super Intelligence”時代已然來臨。
他分析,電腦時代能用“Computer on every desktop”總結,當人們的辦公桌放上電腦,提升生產力的Office便成為殺手級應用。“Anywhere Anytime Computing”則是移動網絡時代的標記,四處遷徙的消費者時刻連網,應用程序能獲取位置資訊,Uber、美團因此帶來價值。
將時間快轉至今,得到AI賦能的應用,不再只是解決疑難雜症,甚至代理人類完成工作。生成式AI與大型語言模型之所以標誌AI 2.0的開展,正是因為AI做為生產要素的成本下降,從專用走向通用,運算不再昂貴,應用就此得到智慧,“你要善用這些應用程序的聰明才智,做過去不方便或不可能做的任務。”
推論成本將是關鍵
不過,雖然生成式AI颳起的旋風未停,但目前獲益最多的,仍是賣鏟子的人。雲端服務商對AI伺服器的需求激增,催動英偉達(Nvidia,又稱輝達)等晶片生產商接滿訂單,效應也外溢到台廠協力廠商,但真正讓消費者有感的應用還在半途,軟體廠商也在尋覓應用場景。
李開復解讀,無論是對企業或者消費者,生成式AI都有市場。前者在企業後勤單位如財務、人力資源領域中,增加員工效率的效益已浮現,幫助消費者完成任務的用法,也在陸續發生。
然而,AI時代和移動時代的巨大差異之一,在於每次大型語言模型運作服務時,皆會產生推論成本。“在移動互聯網時期,都是先獲取大量用户,不收任何費用,待用得開心後,再從他們身上收費。”搜索引擎、社羣網絡和短影音應用,皆遵循此法則。
但AI時代很難靠着補貼式戰法打下江山,因為用户變多,不會帶來規模經濟成本降低的益處。“以前你去燒用户(成本補貼),燒不掉太多什麼,現在每次回答問題,我們都在燒圖像處理器(GPU),最後用户不付費就破產。”無論是和ChatGPT對答,還是以Bing生成圖像,OpenAI與微軟都得在雲端上消耗算力,這也是後者力推AI PC的原因之一。
即便向消費者收費,若費用無法超過獲客成本和推論成本的總和,服務仍無法延續。李開復以近期他提倡的的概念“TC-PMF”(Technology Cost- Product Market Fit)提醒生成式AI創業者,在尋找產品與市場契合程度時,需關照技術成本的變動。
靜態來説,要在模型價格和生成內容品質之間取捨,例如,GPT-4表現優異但所費不貲,GPT-3.5同等模型效果差卻便宜。動態來看,每過九到12個月,基礎模型能力便會顯著升級,例如GPT-3.5至GPT-4的換骨脱胎,以及GPT-4到GPT-4o的化蛹為蝶。
當新模型面世,調用舊等級的模型費用,將下降到原先的十分之一,因此創業者不能只看PMF,而要考慮變動的TC,惟有掌握動態變化,才能生存。
李開復認為,自研基礎模型、搭建AI基礎設施、推出AI優先應用的“三位一體”戰略,是大模型創業者第一時間捕捉到TC-PMF的關鍵,零一萬物目前正在實踐當中。
中美AI競爭各有優勢
有許多人關注科技戰,對中國發展AI帶來負面影響。李開復表示,添購顯卡的問題沒有想像中嚴重,關鍵差異在融資。“美國的創業公司,比中國公司更願意花錢買GPU,理由就是美國市場給這些有能力做大模型的公司,更高的估值。”
這既影響企業發展走向,也影響商業模式。李開復解釋,雖然中國大型語言模型企業算力較少,但人們願意花心思、下苦功,“刻苦耐勞做一些不那麼光鮮耀眼的事情。”例如,調校GPU、修改架構和配合軟體,擠出每張顯卡的最大價值。
李開復分析,美國企業人才頂尖,能開拓出科技最尖端的創新,中國則擅長改善產品、在成本效益間找到甜蜜點。“美國公司做不出拼多多,但是中國公司也做不出Google。”即便大型語言模型領域中國落後半年,但很難説後發一定無法先至。
以大型語言模型企業來看,對比中、美環境,李開復分析,後者在消費者付費意願和客單都高於前者,這讓中國創業者需要在商業模式上下功夫。“因為用户付費習慣不夠多,反而要逼自己找新的商業模式。”例如,當年主打免費的淘寶,便是靠着收取廣告費的另闢蹊徑擊敗eBay。
觀察零一萬物發展,既有面向消費者的應用“萬知”,同時也在中國海外推行企業用服務。萬知背後旗艦模式YI-Large,中文能力足以和GTP-4o相提並論,因此消費者願意埋單,這正是由技術實力撐起;在海外市場拓展也頗有成績,無論是付費意願或者平均客單價都高過中國競業,穩定的SAAS服務,讓零一萬物不用在客製化AI、無法規模化的紅海中,與他人爭搶微薄利潤。
雖然阿里巴巴、百度和科大訊飛等大廠在價格戰中逐底,甚至有部分模型的調取費用壓低至零,但李開復並不擔憂價格戰,甚至正面看待降價情形。不憂慮自家企業,全因零一萬物模型性能優異,在多項國際評測中成績斐然;不擔心整體產業,則是因降價反映技術進展,更代表生成式AI將有機會擴散到更多地方。
他堅定表示,大型語言模型至少還有兩代巨大的模型提升,不只帶動應用發展,同時降低推論成本的定價,未來兩年生成式AI應用將會看到劇烈競爭。
在李開復眼裏,想在大型語言模型競賽做出成績,是最短的時間窗口之內,最有挑戰性的難題。
正如《離騷》中所言,“路漫漫其修遠兮,吾將上下而求索。”一輩子在人工智慧領域打滾,如今重返前線迎難而上,這是李開復的“吾雖艱險,心中樂之”。
李開復簡介
出生:1961年
經歷:曾任蘋果、SGI和微軟等企業高級主管,於微軟工作任內創立微軟中國研究院(微軟亞洲研究院),後至Google擔任全球副總裁與大中華區總裁。2009年創立創投機構創新工場,2023年創辦零一萬物。
榮譽:《時代雜誌》百大全球最具影響力人物、《時代雜誌》全球25大AI領袖
本文出自2024年7月號的《遠見》雜誌。台灣遠見天下文化事業羣將於11月6日至7日,在香格里拉台北遠東國際大飯店舉辦第2024第22屆“華人領袖遠見高峯會”,新加坡《聯合早報》為媒體夥伴。