聯網的大模型,實時性是不是偽命題?_風聞
观察者网用户_1262951-07-27 18:01
來源於“每天學點經濟學”
商業模式的固化與大模型的碰撞,360似乎從未放棄過任何一個數字時代的爆點,但這一次所不同的是,360在推出智腦的同時,更是希望能夠將“大模型拉下神壇”。
有意思的是,消息一經發布,二級市場的動作也開始一直向下。
6月14日,360智腦大模型4.0版本發佈次日,三六零股價由漲轉跌,振幅達到5.66%,結束連續3個交易日的漲勢。
就連2023年上半年的總營收情況也下降狀態。
7月13日晚間,360發佈的2023年上半年業績預告顯示,該公司依舊以營收下滑和虧損收場,不過相較於一季度的跌幅,二季度的業績開始有明顯好轉。
360上半年實現營業總收入約45.7億元,較上年同期下降約2.5億元,同比減少約5.19%,相較於2022年半年度營業總收入同比降幅14.16%,2023年半年度營業收入下降幅度收窄。
其中,第一季度營收為19.66億元,減少22.17%,第二季度恢復增長,約26.04億元,同比增長13.32%。
那麼,在成本與語言模型融合搜索引擎的兩大難題面前,一邊嚮往大模型,一邊又欲將大模型拉下神壇的360,又該如何做到呢?
圖片來源:百度股市通
一、是步後塵,還是帶來新研發?
近期,中國科學技術信息研究所發佈《中國人工智能大模型地圖研究報告》,據不完全統計,中國已發佈10億參數以上的大模型已多達79個。
從大模型的發展來看,AI的發展是迅速的,而傳統搜索引擎在與AI+搜索模式對比下,實際上也是越來越式微的。
回看國內捲起“百模”廝殺後,至今大模型已經遍地開花,無論是通用還是垂域模型,種類和數量都日漸豐富。
同時,各家也積極探索大模型的落地應用,例如360宣佈依託智腦大模型打造數字人社區;百度文心開拓更多行業應用領域;阿里則推出專攻音視頻內容的AI產品通義聽悟。
但總結起來看,各大模型中最常用最基礎的功能有兩個:一個是知識問答,一個是寫作生成。
首先是360,360智腦大模型通過預訓練和微調的方式,實現了生成與創作、多輪對話、代碼能力、邏輯與推理、知識問答、閲讀理解、文本分類、翻譯、文本改寫、多模態(文本生成圖像)等十大核心能力。
很顯然,這些能力不僅是基礎的知識問答,還可以覆蓋大模型全部應用場景,為個人、為企業提供AI服務。
其次,商湯“日日新SenseNova”作為大模型體系的重要一員,“商量SenseChat 2.0”同樣擁有長文本理解、邏輯推理、多輪對話、情感分析、內容創作、代碼生成等綜合能力,並且能夠在與用户的互動過程中精進判斷力與創作智能,實現知識實時更新。
如果根據360智腦的初衷,將大模型聚焦在C端亦或是“普惠”層面上來看,對比同細化垂直領域的大模型,那麼到底誰會做得更好?
就商湯“日日新SenseNova”知識實時更新這一點來看,360在實時信息這一塊結合了自身的優勢,在“實時”問題提問中,提供了“在網上搜索更好答案”的選項,並給出了這些回答在網頁上的參考來源。
但這種實時搜索的優勢僅限於部分問答,在某種特定對比內容問答以及描述生成圖片層面則差了些意思。
先是兩種產品之間參數的對比,知乎“橘生”曾要求360智腦要展示“三星S23”和“小米13”這兩款手機的參數,並從各個方面分析優劣,並作出購買推薦。
360智腦能夠提供各產品的優劣,但在數據上存在着一定的出入。
另外,就普通的描述生成圖片而言,其實也並沒有太多的問題,如果一旦將場景稍微具體後,生成的圖片就沒有那麼準確了。
圖片來源:知乎“橘生”
或許正如360 CEO周鴻禕所説“智腦還像剛出生的孩子,仍舊有不完善的地方”。很顯然,從以上問題來看,360智腦大語言模型+ 聯網搜索,還有很多錯誤數據和場景描述生成等問題需要解決。
事實上,這與競品之間的優缺無關,這是大模型自身數據訓練數量所存在的問題。更重要的一點是,大模型背後的企業也無法保證每一項功能訓練數據的比例。
即便當下大模型已經完成7B參數量,但目前國內的大模型技術仍然處於發展初期,應用場景較少,靠這個項目盈利還為時過早。
二、押寶大模型,但盈利尚早
雖然各大企業先後推出了屬於自己的大模型,但在發展方向上各有不同。
例如百度與阿里更偏向於接入各行業公司;華為則聚焦在金融、氣象、煤礦等多個行業;360智腦大模型應用創新領域AI數字人;騰訊和字節分別是行業大模型精選商店與大模型服務平台;商湯大模型“日日新”主要包括智駕領域。
據悉,360智腦大模型4.0目前仍未對外開放,暫時只接入瀏覽器、搜索、安全衞士等“360全家桶”產品。
為此,在支持商用這個競爭節點上,智腦與一邊是積極接入各行業的百度文心一言,一邊是上架各大應用商店,下載量達到1萬多次的訊飛星火的相比較,顯然是被被甩在後頭。
實際上這也十分的好理解,對於360而言,會更偏向於C端用户的感受以及在方向上的垂直髮展。
不過,就目前而言,雖然智腦為360自研千億參數大語言模型,但根據網友的測評,在基礎性的問答中仍然會存在無法“腦筋轉彎”的錯誤。
在主打問答、生成創作、AI數字人等層面的智腦,的確是偏向於to C,但也需要説明,目前帶給用户的價值是有限的。
更何況,使用開源大模型的項目數量,每個季度都在翻倍。
其中,今年6月,美國紅杉資本發現在其投資的33家創業公司和上市公司中,65%已經上線了大模型應用、94%正用OpenAI的大模型接口(API)開發應用。
它們使用大模型的方法大多較為簡單:直接調用ChatGPT的接口處理私有數據完成特定任務,如多語言互譯、生成文本或者網頁內容摘要等。很少有公司會做更深入的開發,就目前而言更多是用大量數據進行微調模型。
另一方面,對於to B端,企業一邊對大模型十分嚮往,但一邊又會在安全性有非常多的顧慮。説到底,最現實的問題就是大模型不是雲計算,更不是企業數字化這麼簡單,極少的企業會選擇直接接入大模型的API。
就拿ChatGPT來説,據媒體報道,三星公司內部曾在短期內發生了多起ChatGPT引發的數據安全事件。
大致情況就是,公司一名員工將要求ChatGPT幫助自己完成會議記錄,甚至還有員工將軟件源代碼粘貼到ChatGPT中要求進行優化,並要求其找到問題的解決方案。
基於此, 無論是內容記錄亦或是通過大模型進行代碼優化,所輸入源代碼都有可能成為ChatGPT的訓練數據庫。
圖片來源:量子位
如果再進一步延伸就會發現,大模型實際很難成為“行業通”,因為幾乎所有的企業都很難會將自身獨特的知識貢獻到大模型中。
這也就導致大模型難以實現對行業的深度瞭解,一旦問它行業問題,更多是侷限於表面。
當然,360同樣有着清醒的認知,就像周鴻禕所説“在數字安全方面積累了全球最多的攻擊樣本。我會願意把這個貢獻給行業嗎?我會願意把它訓練到公有的大模型裏嗎?不可能。”
總得來説,這也就註定了大模型垂直髮展所具有的難度。
三、360如何將大模型拉下神壇?
360周鴻禕曾在發佈會上説道:把大模型“拉下神壇” 變成每個企業能直接使用的東西。
通過智腦發佈會的內容簡單的理解就是,對行業進行垂直訓練,讓大模型自上而下,變成每一個人都可以直接拿來使用的模型。
專注服務於垂直領域的模型,能做到普惠到個人,或許將是一個趨勢。但就目前而言,360智腦存在一定的難度。
從當下ChatGPT的日活量來説,純對話式、問答的大模型已經不能滿足人們的個性化需求。更何況,AI帶來的是效率提升,是新的工作方式,而不是直接去替代某個人或是簡單“復刻”一個數字化的自己。
某種程度上也可以看出,從大模型動作頻頻,卻缺少問答之外的互動創新。
另一方面,為了更聚焦安全問題,360模型不具有連續對話能力。
根據官方的説法,360智腦作為“新搜索”的落地應用,這個產品的重點,也應該是在信息檢索能力和答案準確性、用户體驗以及實時性上。
換個角度,倘若360智腦去掉“聯網搜索”鍵,那麼實時性也將不再具備。
不過,語言模型+搜索引擎的模式,對背後語言模型的考驗也是極大的,語言模型還需要對搜索信息作為辨別,這個在大模型發展的初期格外的明顯。
直白一點來説,語言模型+搜索引擎的方式,還需要經過充分優化提升語言模型對搜索信息的辨別能力。