從ChatGPT的崛起,看科大訊飛的變化與生機_風聞
读懂财经研究所-注册制时代,价值新坐标。02-19 20:26
週期,是人類社會最樸素的內核規律之一。直至18世紀中葉亞當·斯密以《國富論》開啓古典經濟學以降,人們愈漸掌握現代經濟學理論工具用以解構這個世界,這一過程裏,社會經濟領域“長中短波”式的峯谷變幻,不斷強化人類對於經濟週期的敬畏與宿命感。
這種宿命感,換做當代人最為熟識的經濟現象便是:第一至第三次產業革命。此刻仍處於上一輪以“電子計算機—移動互聯網”技術為基石的創新康波週期的末端,我們仍正在為開創新一個60年的產業革命新週期不斷求索。
如今,新週期的時點或許已經到來。一個最直接的信號,面向C端市場的ChatGPT迅速躥紅。上線兩月,ChatGPT的月活用户就超過1億,成為互聯網歷史上用户增長最快的應用。
正因為如此,科大訊飛、百度等國內科技公司開始紛紛入局跟進。以此為時點,一場關於未來AI產業地位的競爭就此拉開了帷幕。
/ 01 /ChatGPT,第四次工業革命的開始
過去相當時間裏,AI落地的探索更多體現在垂直領域,比如智慧醫療、智慧城市等等。但ChatGPT的出現卻為我們提供了另外一個可能:跑通AI通用範式,再落地到具體場景裏。
於AI產業來説,ChatGPT的最大意義在於,它向在技術短缺狀態中停留了大半個世紀的AI研發者們,傳達了這樣的信號:走出實驗室,到了與人類開展有效互動的時候了。
作為一款建立在大語言模型之上的文字聊天產品,ChatGPT比迄今人類出現過的任何智能聊天類產品都要強大,這其中也包括蘋果的Siri。這也讓ChatGPT變成了一個名副其實的現象級產品。作為互聯網歷史上用户增長最快的應用,ChatGPT上線兩月,月活用户就超過1億。
從整個社會發展角度來説,作為標誌性機器智能生產力工具,ChatGPT的出現與蒸汽機有着類似的意義。體現在三個方面:對部分傳統行業的顛覆性、對各個產業效率的提升、開啓新一輪長波經濟週期。
對部分傳統行業的顛覆性,最直接的體現是谷歌的股價。在谷歌加持的類ChatGPT產品Bard回答問題出錯後,它的市值在兩天內跌掉了12%,損失超過1500億美元,被稱為史上代價最大的錯誤之一。
原因在於,ChatGPT可能將改變人類生產和獲取知識的方式。因為它可能讓知識生產的門檻大幅降低,並藉此佔據新的人類探索和學習的中心位置,進而顛覆搜索引擎的價值。
如果説,ChatGPT對搜索引擎的顛覆尚未發生,但其對各個產業效率提升的價值正在顯現。從目前看,ChatGPT在很多場景已經足以承擔部分人類的腦力勞動,比如按照指定的要求收集整理信息,撰寫新聞、特定主題的文章,編寫程序等等。
以ChatGPT為起點,生成式AI基於生產效率優勢將衍生出更多先進的商業模式,帶動生產關係的範式變革,進而開啓新一輪經濟增長週期。
AI的範式變革究竟會如何演繹到何種程度尚不清楚。但可以明確的是,ChatGPT的出現為所有AI公司都打開了一扇新的大門。近期,科大訊飛、網易、360、浪潮、崑崙萬維等公司,紛紛宣佈下場ChatGPT。其中,科大訊飛更是表示,在今年5月率先落地AI學習機產品中,就會搭載類ChatGPT技術。
作為AI行業龍頭,科大訊飛為何能夠領跑ChatGPT追趕賽?其擁抱ChatGPT的可能性又有多大呢?
/ 02 /擁抱ChatGPT的可能性
OpenAI給出了AI產業化的一條新路徑,後來者想復現ChatGPT,算法、算力、數據三方面缺一不可。
在三者中,算法比較好理解,如同人類大腦,決定了AI的學習能力。算力,則更多意味着一種資源,決定了算法的運行效率。在實際過程中,超大模型由於參數規模大、數據體量大,因此需要更大的算力支持。
據瞭解,ChatGPT單次模型訓練耗時1個月,訓練成本達1200萬美元。考慮到超大模型的訓練需要大規模計算集羣以及對應的模型並行算法框架的支撐,中間算力需求巨大。根據科大訊飛副總裁、研究院執行院長劉聰判斷,1000張主流卡容量的獨立計算集羣是完成該類任務的門檻之一。
在數據方面,對於預訓練模型來説,數據的質量和數量直接影響模型的質量。數據之於算法,更像是一本本優質教材,能夠決定AI會學到哪些知識。比如,ChatGPT的成功,就很大程度上依賴於互聯網上海量的高質量英文文本數據。在全球最大的百科網站維基百科上,擁有最多百科文章的語言正是英文。
以上三方維度,恰恰也為我們評估科大訊飛能否推出ChatGPT類產品提供了參考。
先説算法,一個業內主流觀點是,儘管沒有率先做出來Transformer、GPT-3,但國內企業在大模型上的技術,距離ChatGPT的差距其實也僅在半年到兩年之間。
對於像科大訊飛的AI龍頭企業來説,實際差距可能更短。在算法領域,科大訊飛在Transformer深度神經網絡算法方面擁有豐富經驗,目前已經廣泛應用於科大訊飛的語音識別、圖文識別、機器翻譯等任務並達到國際領先水平。
同時,科大訊飛還創新提出了知識與大模型融合統一的理解框架X-Reasoner,並在認知智能技術領域,2022年累計獲得了常識閲讀理解挑戰賽OpenBookQA等13項世界冠軍。在AI算法領域深厚積累,也是科大訊飛能夠迅速跟進ChatGPT類產品的重要原因。
除了算法領域具備深厚的積累外,科大訊飛在算力上也有着紮實的支撐。比如,公司在總部建有業界一流的數據中心,為大模型訓練平台建設奠定了很好的硬件基石。
不僅如此,科大訊飛在工程實現方面也有着很多積極的探索。比如,科大訊飛實現了百億參數大模型推理效率的近千倍加速,為未來更大更多認知智能大模型技術經濟實惠規模化應用提供了可能。工程實現技術對大模型走向規模化應用中至關重要。
在數據積累上,憑藉多年的消費場景開拓,科大訊飛在多年認知智能系統研發推廣中積累了超過50TB的行業語料和每天超10億人次用户交互的活躍應用,為訓練實現達到人類專家水平的行業認知大模型提供了海量行業文本語料和用户反饋數據,也為基於大模型的創新應用研發和試點推廣提供了場景保障。
在領先的AI算法、紮實的算力支撐以及豐富的文本語料三者疊加之下,科大訊飛成為國內為數不多有能力複製ChatGPT產品的AI公司。
當然,ChatGPT對科大訊飛的意義並不止如此。幫助投資人重新認知科大訊飛根據地戰略的護城河以及大模型路徑與產業深度的融合機會,才是ChatGPT之於科大訊飛最大意義所在。
/ 03 /ChatGPT紮根產業化的啓示
ChatGPT跑通AI通用範式,讓很多人產生一個疑問:ChatGPT這樣通用型產品進一步完善後,是否會進入專業領域對科大訊飛這樣專業打法的AI公司產生衝擊?
從目前看,這種看法可能有些多慮。由於專業領域數據的封閉性,通用型的AI產品往往很難發揮實際作用。舉個例子,ChatGPT的信息輸出很大程度上依賴於海量的數據學習,但對很多特定的領域來説,數據相對封閉,通用模型很難獲取,典型的就是醫療數據。在這樣的領域,專業性的AI模型仍然處於明顯的優勢。
也就是説,ChatGPT通用型AI產品的出現,不僅不會對科大訊飛的業務產生衝擊,相反再次證明公司業務的護城河,及其AI根據地戰略的有效性。
考慮到科大訊飛在行業應用方面有着諸多的案例,大模型路徑的跑通也讓科大訊飛在很多行業場景中有了更大的用武之地。
從目前看,針對各個行業不同的需求,未來大模型會向各層級的個性化模型不斷延伸,形成更符合行業需求的產品。只有在上述技術演化的基礎上,以自然語言處理為代表的人工智能算法才有可能重構互聯網和移動互聯網的產品形態。
與絕大部分AI公司不同,科大訊飛恰好在技術和行業應用方面都有着深厚的積累。為了進一步提高大模型在細分行業的實用性,科大訊飛計劃採用“1+N”架構,其中“1”是通用認知智能大模型算法研發及高效訓練底座平台,“N”是應用於教育、醫療、人機交互、辦公、翻譯、工業、汽車等多個行業領域的專用大模型版本。
例如,通過學習海量醫學教材、論文和病例,實現專業的醫療領域對話式AI系統,打造“每個醫生的AI診療助理,每個人的AI健康助手”。
長遠來看,以通用型產品優化細分行業的AI解決方案,科大訊飛有機會為AI產業開闢新的路徑,實現自身指數級的擴張,進而加速全社會經濟領域的創新進步。也許十年後再回過頭來看,你可能發現,ChatGPT的出現是科技大停滯的分水嶺,一個嶄新週期即將開啓。此後:大海航行靠AI。
