文心大模型殺瘋了!一家的調用量,比國內200家大模型還要大_風聞
易简财经-易简财经官方账号-易简财经是大湾区领先的财经新媒体。昨天 18:04
11月15日,作為與第二十五屆高交會同期舉辦的重大活動,2023年西麗湖論壇以“前沿·變革·聯結”作為年度主題,在深圳大學城國際會議中心舉辦。
第一天是開幕式暨全體大會,2015年圖靈獲獎者馬丁·愛德華·赫爾曼、硅谷AI研究院創始人皮埃羅·斯加魯菲、百度創始人李彥宏等AI領域的大佬都來到了現場,會上還發布了7項涉及AI大模型、芯片等新興產業領域的重大成果。
在現場,李彥宏發表了關於AI原生時代的兩個“冷思考”和三個“熱驅動”的主題分享。
分享中,李彥宏一句“文心大模型一家的調用量,恐怕比200多家大模型的調用量加起來還要多”,一石激起千層浪。
文心大模型,1個打200個?
今年以來,我國大模型產業駛入“百模大戰”階段,賽道熱度空前,大戰愈演愈烈。
6月份,國內已經發布的大模型是79個,但到了10月份,這個數字已經變成了238個,相當於4個月時間增加了兩倍,實際數量或許不止於此。
這麼多大模型,都是有價值的嗎?
李彥宏認為,很大程度上,這相當於重複造輪子,是一種資源浪費。
因為要開發好用、可用的大模型,不僅本身存在技術和成本門檻,耗費的資金巨大,不下血本根本玩不起。
李彥宏
以OpenAI為例,GPT-3的單次訓練成本就高達140萬美元,對於一些更大的大模型,訓練成本介於200萬美元至1200萬美元之間。
再看百度,過去十年間,百度在研發上累計投入了至少1462億。哪怕是在“AI寒冬”的 2022 年,百度研發投入也有233億元,研發強度 18.85%,排名中國民營企業研發強度第一。
而且,大模型具有明顯的規模效應,只有當你的模型參數規模足夠大,訓練數據量足夠多並且能夠不斷投入,進行迭代,才能夠產生智能湧現。智能湧現,即為大模型觸類旁通的能力,也就是沒有教過的東西,大模型也會。
可放眼國內,能夠符合這些標準的公司屈指可數。
這就導致如今大模型市場遍地開花,可產品和產品之間卻沒多大差異,甚至一些產品還是套殼,根本沒有智能湧現能力的情況產生。
而在上個月,百度發佈了文心4.0版本,這是繼今年5月百度迭代文心大模型3.5版本以來的又一次重大更新。
據李彥宏表示,這是迄今為止最強大的文心大模型,在理解、生成、邏輯和記憶四大能力上,都有明顯提升,綜合能力“與GPT-4相比毫不遜色”。
李彥宏篤定道,“國內有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什麼使用量。”
他還在現場指出,“文心大模型一家的調用量比這200多家大模型的調用量,加起來還要多。”
大模型太多,AI原生應用太少
可是不需要這麼多大模型,那需要什麼?
李彥宏給出了方向,AI原生時代,我們需要100萬量級的 AI 原生應用,但是不需要 100 個大模型。
李彥宏認為,人類進入AI時代的標誌,不是產生很多的大模型,而是產生很多的AI原生應用。
AI原生應用,就是基於大模型智能湧現後產生的理解、生成、邏輯和記憶能力而開發出來的應用。這些能力是過去的時代所不具備的,因而才能打開無限的創新空間。
“我們看PC時代,基本上只有Windows一個操作系統,但是基於Windows系統開發的軟件有很多;移動互聯網時代,主流操作系統也只有安卓和iOS兩家,而移動應用則有800萬之多。”
如果將ChatGPT和文心一言,放到移動時代,它們就相當於iOS和安卓。而構建於兩者之上的,豐富的AI原生應用生態就是各種移動應用。
2007年,喬布斯推出了第一代iPhone,但人們公認的移動互聯網爆發節點,卻是2010年iPhone 4誕生時。
因為最開始喬布斯沒有想着在手機上安裝應用,而是把手機看作是雲服務的終端,直到他推出搭載了完善的系統生態的iPhone 4後,才讓原生應用迎來大量爆發,互聯網得以加速發展。
迎來AI時代,人們仍有可能複製同樣的故事,即用構建起的繁榮AI生態,推動新一輪的經濟增長。可遺憾的是,國內對AI原生應用的重視,還不夠多。
“如果我們看國外,除了有幾十個基礎大模型之外,實際上,已經有了上千個AI原生應用,這是在中國市場上沒有的。”李彥宏稱。
應用商店監測平台Sensor Tower數據也顯示,2023年上半年,美國市場貢獻了55%的AI應用總收入,歐洲市場佔20%,包括中國在內的其他市場,加起來只佔比25%。
共創AI原生時代
但李彥宏也指出,直到今天,不論中國還是美國,最好的AI原生應用還沒出現。這正意味着,從現在開始推動AI原生應用落地還不晚。
在這方面,掌握了AI大模型核心技術的百度,已經先行一步,對旗下各個產品線進行了AI原生的重構,給大家帶來了前所未有的智能化體驗。
比如,新搜索現在回答用户提出的問題時,不再是提供一堆鏈接,而是通過對內容的理解,生成文字、圖片、動態圖表等多模態的答案,讓用户一步獲得滿足。
再比如,以前準備一場演講,要耗費好幾天時間製作講稿和PPT,現在寫3000字的文章可能一分鐘就完成了。現在,百度文庫可以在1分鐘內生成一個20幾頁的PPT,包括圖表生成,格式美化等,成本幾乎是零。
不僅如此,百度還在孵化全新的AI原生應用。比如智能代碼助手Comate。據李彥宏透露,百度現在每新增100行代碼,就有20行是AI生成的,而且這個比例還在快速增長中。這樣的AI原生應用,通過人機協同,大幅提升了研發效率。
李彥宏強調,“百度從做AI的第一天起,就非常重視生態的建設,目前已經擁有了超過800萬AI開發者。”
值得一提的是,不久前,百度已經上線了大模型插件平台,無論是個人還是企業,都能通過這個平台,把自己的數據和能力,快速變成插件。比如法律助手、簡歷助手、裝修助手、旅遊、辦公等等插件。
插件是一種特殊的AI原生應用,不僅容易上手,還能讓企業在私有數據沒有泄露風險的情況下,更便捷地用到大模型能力,大大降低了開發者門檻,有利於構建繁榮的AI原生應用生態。
可以説,百度已經提供了良好的土壤與環境。對於囊中羞澀的創業者們來説,與其仍舊在“百模大戰”中卷生卷死,重複造輪子,不如換一個選擇,在為自己帶來更多可能性的同時,也為AI原生時代的加速到來,添上一把火。
•END•