在AI與信息交互之間:QQ 瀏覽器的邊界探索_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头2021-12-01 18:54
互聯網1.0時代,網絡是人們查閲資料、瞭解世界的重要窗口,這個時期人與信息的關係是單向的,信息如一本本靜態的電子化書本需要用户觸及後再閲覽獲取;
互聯網2.0時代,互聯網開始成為人們獲取價值信息和社交不可或缺的重要工具,人與信息的關係開始有了雙向的交互,信息與人共同編織、豐富着這張時代大網。
隨着推薦技術成熟以及信息流業務急速擴張,用户與內容的交互模式逐漸從“人找內容-搜索”向“內容找人-推薦”遷移,並且這種趨勢仍在擴大它的外延。搜索作為人與內容信息交互的一種重要方式,它的作用並沒有削弱,用户在推薦場景的沉浸消費反而會激發出新的搜索需求。
從本質上看,搜索與推薦關注的交匯點都是交互的核心——用户興趣,因此如何在當前信息分發場景中更好滿足用户興趣是一個重要命題。而瀏覽器是用户在互聯網2.0時代與世界交互信息的重要入口,也是展示搜索與推薦技術精進的絕佳觀察點。
瀏覽器作為一款綜合性APP,承載了搜索、信息流推薦、小説等多種用户消費信息的場景。這些場景都有大量的內容理解、內容生成方面的AI需求。不同的場景都有各自的特點,比如搜索的Query意圖分類、信息流的內容推薦、小説的內容分類等。
這些特點也讓瀏覽器成為全面觀察AI技術在自然語言語義理解方向發展很好的窗口,跟隨推薦技術的發展脈絡,我們發現騰訊旗下的QQ瀏覽器應用月活用户已經超過4億,儼然成長為瀏覽器中的超級APP。
在國內,騰訊是較早大規模實踐AI推薦技術的廠商之一,旗下的QQ瀏覽器過去幾年來在AI和推薦技術方面經歷了幾次大規模重構和迭代,現在已經蔚然成森。這幾年QQ 瀏覽器在技術層經歷了怎樣的厚積?在信息繭房和視頻化難題的泥沼中,QQ 瀏覽器做出了哪些選擇?其實戰經歷對於瀏覽器行業來説,還是具有一定的學習和參考價值的,值得我們探討一下。
信息流“沼澤”中QQ瀏覽器面對的選擇
在瀏覽器中,信息流主feed是圖文、短視頻、小視頻混合形態,這也是推薦算法應用的主場景。在這些場景中,瀏覽器在不斷發展的進階過程中容易遇到這些痛點難題:
1.信息繭房現象。內容和資訊類平台不光要推薦熱門的信息內容,也面臨解決一些初始信息的冷啓動問題,推薦系統如何公正有效的推薦優質內容,使得好內容獲得更多的曝光機會,觸達更多的人羣。
2.面對具有豐富場景的瀏覽器,其背後的AI研發需求多樣複雜,傳統的研發模式研發週期長,效率低。比如內容視頻化方向,怎麼打更好的標籤以及做更好的多模態,對視頻的理解和多模態的理解如何做到準確把控等。
3.細分場景的多樣化與精細化運營的需求,信息流目前發展到了精細化運營的階段,需要針對多種多樣的細分場景進行敏捷優化。
無論是對於用户來説,信息內容的繭房現象帶來的一畝三分地的侷限“視野”,還是企業面臨的形態複雜、內容多樣化進階的AI技術需求等,這些對信息流內容產生影響的挑戰都亟需解決,為內容信息的獲取和交互還一片輕快的價值體驗。
QQ瀏覽器在面對上述挑戰中,選擇運用預訓練+finetune+AutoML的新範式和多目標多場景聯合優化的新深度模型等創新來應對信息流這方面的技術挑戰。在騰訊QQ 瀏覽器舉辦的AI算法大賽中也可以窺視到多模態技術與超參數對這些瀏覽器難題的優化,這兩個技術也是此次比賽的兩條賽道。
比如在視頻流的場景中,多模態的技術可以根據視頻觀看的時間及關注的興趣及行為讓下一個視頻更符合、相似目前觀看的視頻,在語義上的相似可以讓用户的體驗更好。QQ 瀏覽器在多模態技術中也做了評價視頻語義相似度的問題,可以更精確地評價兩個視頻的文本區別,為用户不再推薦重複的內容,增強在推薦方面的泛化和興趣探索的能力,很好地緩解信息繭房的問題。
而超參數技術可以實現多目標融合,也就是在推薦系統中,從刷視頻的點擊率演進到點擊、關注、點贊等同時完成,超參數搜索把以前人工尋參的方式通過網格搜索、非個性化尋參到個性化尋參的方式提升效率。在騰訊QQ瀏覽器實踐過程中可以減少 80% 以上的尋參時間,大大提升了推薦系統的研發效率。
我們知道瀏覽器在實際的推薦和搜索業務場景中,有異常豐富且持續演化的內容需求,這些龐大的內容數據並沒有客觀清晰的定義,數據標註也就成為內容算法研發的核心瓶頸,而預訓練大模型是解決這一問題的“良藥”。
聚焦推薦與搜索:當瀏覽器擁抱大模型
預訓練大模型也是近兩年AI產業中最火的關鍵詞之一。目前比較有名的模型參數量都已經達到萬億級別了,應用場景差異也比較明顯。以 OpenAI斥巨資打造的GPT-3為例,它依然是偏 NLP 的模型。在AI大模型的探索上,無論是着眼於提升超大規模AI算力,還是突破學術前沿的角度,本質上都是通過將海量的數據進行預訓練、預集成,形成高魯棒性、低樣本量需求的大模型。企業可以根據自身的應用場景,在大模型的基礎上進行少量的調參即可完成落地。
而瀏覽器與大模型的結合,可以將瀏覽器背後場景的大量內容理解、內容生成中的AI研發所需樣本量大大降低,解決標註量與成本這個在瀏覽器整體業務場景中的核心瓶頸。
QQ瀏覽器實驗室自研了預訓練模型“神舟”,這個模型具有百億參數的訓練能力,可以為搜索、推薦、內容理解等多種業務場景起到直接幫助,提升各種自然語言理解算法效果。神舟預訓練大模型專注中文自然語言理解,基於預訓練的研發模式,可以提前把語言語義中通用的知識學習到預訓練模型中,針對下游具體的任務只需要學習任務相關的知識。
通過該模型QQ 瀏覽器可以微調和滿足業務中出現的如評論理解、搜索 Query 推薦等NLP 需求,可以減少 40% 以上所需的標註數據量和相應的研發時間,節省了標註的成本,大大提升了研發的效率。在學術上,也刷新了業界紀錄,登頂了中文語言理解測評基準 CLUE 榜單上,成為首個在中文自然語言理解綜合評測數據上超過人類水平的預訓練模型。
當前神舟大模型已經逐步應用於 QQ 瀏覽器的搜索、看點資訊、小説等多個場景。隨着大模型進一步的迭代和實踐,也會深度改造 QQ 瀏覽器的搜索推薦能力,更好地理解並滿足用户表達背後的意圖與需求。
大算力時代,機器變得更加理解信息與人,比如在醫療領域的問診問答、交互對話等實際場景中,大模型可以為語義的理解帶來更強的綜合效果,而瀏覽器擁抱大模型,可以更好地沉澱大量的知識,幫助我們更準確地探索AI與機器學習的邊界。
在全面數字化遷徙之旅中,我們獲得信息的渠道和服務方式也變得越來越便捷智能,對於瀏覽器行業來説,讓人們以優質的體驗零門檻獲取價值信息是核心訴求,基於這個變化與訴求,QQ 瀏覽器也將自己的技術品牌升級為QQ 瀏覽器實驗室以更好地聚焦服務用户。
QQ瀏覽器實驗室:走向下一代信息交互
對於下一代信息的交互平台,每個人心目中的瀏覽器都不一樣,我們可能會藉助元宇宙的技術,通過手勢、眼神甚至是意識來操控搜索與推薦,當我們進入沉浸式的新搜索界面時,可能很多的邊界都會模糊甚至消失,比如消費和應用的邊界,體驗與內容的邊界,體驗與創作的邊界等,可能搜索就是一個創作的引子,發現就是探索開始的價值,用户與內容與應用開始層層遞進深入,體驗和交互的方式全面融合。
無論是哪種未來瀏覽器,本質上都是搜索網羅信息,精準推薦價值內容,這也是信息技術發展過程中的不變內核。無論未來信息交互的前景怎麼變化,前提是技術的不斷更迭、突破才能帶來體驗的重構。
(左起:騰訊副總裁郄小虎、信息平台與服務線CTO徐羽、騰訊副總裁殷宇)
QQ瀏覽器瞄準長線的數字化趨勢價值,成立“QQ瀏覽器實驗室”技術品牌,依靠AI、搜索、大數據、推薦算法的技術研究,提升信息與服務的獲取效率,幫助用户零門檻地獲取價值信息和服務,革新用户與世界的交互方式。
近些年來,我們發現騰訊越來越重視AI技術能力的構建,也成立了一些技術品牌,比如TEG(技術工程事業羣)和CSIG(雲與智慧產業事業羣),這也是大家心目中離技術最近的品牌。以內容為主的PCG並沒有得到足夠的關注。隨着PCG技術中台的成立,推薦AI中台也成為騰訊技術平台中的核心中台,而QQ瀏覽器實驗室是PCG技術中台的核心支撐中台模塊之一,不斷為騰訊的推薦業務賦能。
實驗室是創新不斷誕生並生根發芽的地方,搜狗搜索團隊併入後,全網搜索的技術能力與騰訊垂直搜索的能力形成互補,強強聯手,這個實驗室就聚合了信息交互中最核心的兩個技術,可能是我們邁入未來沉浸式搜索交互的第一步。
我們知道,信息技術交互平台的發展不斷進階的目標就是消除鴻溝與隔閡,縮短人與人、人與信息的距離。騰訊信息平台與服務線CTO徐羽也公開表示QQ 瀏覽器的進階目標,與之相似都是緊密連接信息與價值,拓寬用户瞭解世界的眼界。打造互聯網未來30年的信息服務工具,做技術的擺渡人,讓價值信息更好地網羅服務生活,成為探索未知的下一代超級窗口。
人類歷史的長河中,隨着信息技術的不斷更迭,會越來越注重信息與價值的準確與高效,這也就意味着推薦系統是個無限增長且沒有最優解的技術體系,不斷進化是它的特點,因此理解用户的能力也會不斷地深入,這樣持續洞察探索推薦的新趨勢和方向,會為用户帶來新一代的交互體驗與價值賦能。