小i機器人:中國式AI力量,探索場景商業化之路_風聞
阿尔法工场-阿尔法工场研究院官方账号-中国上市公司研究平台03-27 11:11
大語言模型底層技術突破,為中國智能交互機器人帶來劃時代機遇。
3月24日,OpenAI新動態再次引發市場熱議。OpenAI宣佈ChatGPT將支持第三方插件,以訪問更多信息,以及增加相應的功能。
從國內外互聯網巨頭紛紛推出“自家的ChatGPT”產品,到微軟旗下多款產品宣佈結合ChatGPT技術。一連數日,ChatGPT熱度居高不下,其身後的生成式AI技術和大語言模型技術也逐漸浮出水面,備受關注。
本質上,生成式AI(Generative AI)是一種深度學習模型,由生成器負責生成內容,判別器負責判別源數據和生產內容之間的差別並提供反饋。
大型語言模型(Large Language Models,LLMs)則是在生成式AI之上,通過對大規模語料庫的學習,來理解人類語言的問題和答案之間的關係。
大型語言模型與以往的語言模型最大的不同,在於其擁有“湧現能力”(Emergent Ability)。
湧現能力是指,在模型規模超過某個閾值之後,模型性能會打破之前線性增長的規律,實現躍升式突變。簡單地説,就是實現“質的飛躍”。
線性增長(左)與打破閾值後的突變(右),來源:知乎
而“大規模”就是實現這一質變的關鍵因素,這通常意味着百億或千億級的參數量。
而大型語言模型帶來的突破,最直接影響的行業,就是智能交互機器人。
01 大型語言模型:智能交互機器人的新里程碑
智能交互機器人,也就是我們通常所説的“聊天機器人”,可以通過和人類交流,提供相應的回答和服務。
智能交互機器人按其設計目的劃分,一般分為信息型、任務型、對話型等三種類型。
信息型聊天機器人提供特定領域的知識或信息,任務型聊天機器人幫助用户完成某些特定任務,對話型聊天機器人則能夠與用户閒聊或娛樂。
無論輸出內容還是服務,如何在輸入階段就能準確理解甚至“思考”人類語言意圖,是所有智能交互機器人產品的核心技術問題。
在智能交互機器人的第一階段,基於規則的專家系統和機器學習的結合,被認為是行之有效的技術方案。由此,機器第一次實現了對人類語言的“理解“。早在2004年,小i機器人(AIXI.US)推出的Chatbot,正是國內最早應用這一技術的產品。
小i機器人早期產品,來源:Lofter
這一階段,機器理解能力的靈活度相對有限,有時需要用户去“遷就”機器所能識別的語義邏輯。如果表達的方式不對,便會帶來交流障礙。
為了解決這一問題,包括小i機器人在內的許多開發者,都選擇引入深度學習技術和預訓練模型——這是智能交互機器人技術的第二階段。大量的數據和訓練,使機器開始能夠自動識別和理解人類語言,對話的自然度得到了大幅提升。
如今,大模型時代,智能交互機器人邁入第三階段。
與此同時,人們對智能交互機器人的要求也早已不限於“一問一答”。
在進行更自然、流暢、連貫和有邏輯性的對話、這一“智能化”基礎需求之上,根據用户的語境、情感和偏好提供服務的“個性化”需求,以及支持圖形、聲音、視頻等多種媒體形式的“多模態”互動需求,都已成為聊天機器人不可缺少的功能。
高頻需求場景切換,促使智能交互機器人有望從娛樂工具變成提升效率的生產力工具。正如ChatGPT推出之初,很多博主用它來寫段子吸引流量,直到微軟將其與Office產品結合,才讓“打工人”由衷感到切實震撼。
技術進步切入工作和生活場景,進而轉化為生產力提升,才是用户真正關注和願意為其買單的關鍵。
來源:微信
在此背景下,專業化、垂直化和場景化成為了智能交互的下一個新命題,也是新趨勢。
很快,曾經的聊天機器人,將被用來應用在不同行業和領域,提供專業化和垂直化的解決方案。
特定領域知識庫和數據集,也將進一步訓練和微調,以提高對話質量和準確性。同時,智能交互機器人還能根據不同場景提供定製化的功能和服務,滿足用户在教育、醫療、金融、旅遊等各個方面的需求。
大語言模型帶來的,正是支撐這些新需求趨勢的技術基礎。
02 場景和數據打開巨量市場
據弗若斯特沙利文,2017年至2021年中國人工智能市場規模由545億元增長至2607億元,年複合增長率達47.9%。
ChatGPT所運用的生成式AI技術,被Gartner列為最有商業前景的人工智能技術,預計在2年-5年內進入成熟期。智能交互機器人所運用的對話式AI技術,可被視作生成式AI技術的一種。
同據弗若斯特沙利文,2021年中國對話式AI市場規模為82.7億元,2026年預計達265.8億元,年複合增長率26.3%。
其中,B端垂直領域應用被認為是主要的增長潛力來源。
來源:弗若斯特沙利文
深挖垂直領域應用是行業的共識。360公司創始人、董事長兼CEO周鴻禕在一次訪談中提到,OpenAI找了1000家垂直的SaaS公司,將專門訓練垂直領域應用。
早在智能交互機器人的第一和第二階段,深挖B端垂直領域就已被證明是成功的商業化路徑。
2011年,當Siri還只是作為iPhone配套的新功能剛剛推出時,小i的聊天機器人已經轉型B端業務,獲得了金融、通信等諸多行業巨頭的訂單,直接貢獻了營收的增長。
來源:小i機器人官網
基於本輪大語言模型的技術突破,商業化比拼的仍舊是場景和數據,而不是算力。
以ChatGPT為例,許多用户都感受到中文回答相較英文更有侷限性。這是因為其訓練數據主要運用的是英文。
中國電子銀行網文章提到,“RLHF論文中的訓練數據英文佔比99%+,西、法、德語還佔了剩下的大部分,中文估計就是0.0x%這個級別。“
想在中國將大語言模型帶來的進步充分發揮,必須擁有對中文使用場景的深刻理解,以及累積出豐富的中文數據集。
然而,相對於英文數據,中文大語言模型的數據集是極其稀缺的。
中文數據在互聯網的開源程度較低,數據規模相對較小,且數據質量參差不齊,高質量的無監督語料和指令數據嚴重不足。並且,垂直細分領域的數據集的獲得難度更大,鮮有公開數據,數據積累需要較長的週期。
因此,早已深耕在中文智能交互機器人領域的頭部公司,將是智能交互商業化時代最有潛力的先行者。
03 新一輪技術突破紅利
擁有20餘年積累的龐大中文語料庫的小i機器人,擁有這一競爭中最重要的資源。
小i機器人成立於2001年,擁有自主研發的智能交互機器人知識產權,專注於以自然語言處理為基礎的認知智能相關技術的產業化落地。
2023年3月9日,小i機器人在納斯達克上市。
來源:小i機器人官網
語料資源對B端垂直領域尤為重要。對於特定行業來説,通過特定領域的數據集訓練,並結合基於人類反饋的強化學習,大型語言模型將在特定行業和領域得到更廣泛的應用。
多年深耕,令小i機器人在多個垂直領域積累沉澱了海量的知識庫和語義庫,具有將特定行業語料與大語言模型相結合的豐富經驗和技術優勢。
商業化落地能力,是小i機器人的另一優勢。
AI行業參與者往往重研發、重燒錢而缺乏落地經驗。但是,小i機器人最早將人機交互技術引入了大規模商用。小 i 機器人協助銀行打造的虛擬客户助手,作為典型案例得到Gartner推薦。
智能對話機器人銀行客户案例,來源:小i機器人
目前,小i機器人的客户已涵蓋近千家企業及政府機構。客户名單包括三大電信運營商,交通銀行、建設銀行、浦發銀行等金融機構,華為、小米、東方航空、通用汽車等大型企業。
大語言模型的技術突破,也正是小i等待已久的機遇。
儘管小i已是行業中少有的極其重視產品應用場景開發的公司,但上游基礎技術的瓶頸侷限了商業化的空間。AI作為仍處於早期發展的行業,概念與應用之間,還差着無數項技術攻堅。
對垂類市場需求理解深刻的小i機器人,一俟上游基礎技術突破,便可以激發出應用端無限想象力,從而帶來增長機會。
其實,在創新領域抓住商業機會上,小i機器人的成功經驗,已得到商業實踐驗證與客户的高度認可。
例如,繼智能客服實現行業領先地位後,小i又在AI+建築領域展開探索,推出了全程自動化的智能審圖等產品,降低建築行業成本。2021年小i和中國建築(601668.SH)簽訂兩項AI+建築領域的新合同。
AI智能審圖產品,來源:小i機器人
商業化落地場景和行業的不斷豐富,為小i機器人帶來業績提升。2021年,小i機器人營收實現3252萬美元,同比增長134.6%,並於同期實現扭虧為盈,淨利潤達到337萬美元。
隨着大語言模型技術的重大進展和生成式AI應用領域拓寬,可以想見,小i機器人也將在更多垂直領域研發出具有商業價值的創新產品。
艱難環境下,市場亟待尋求新方向之時,底層人工智能技術革新,猶如一顆橫空出世的新星。
有生之年,躬逢其盛。
技術的進步並不會變成一家獨大的壟斷競爭。供給側的結構性變化,會激發需求側產生更多想象力,從而為全行業帶來新的商業機會。
能夠敏鋭捕捉需求變化、並有能力快速追蹤落地的公司,將在劃時代的機遇來臨時,走在同業的前列。