中國科技巨頭鏖戰ChatGPT,誰能搶佔先機?_風聞
根新未来-02-24 10:11
文/觀察未來科技
本質上來看,ChatGPT就是一種基於 InstructGPT算法架構開發的大型預訓練語言模型,都是基於大模型、大數據的不斷訓練。ChatGPT的背後,除了常規的萬億級別語料投餵之外,還依託於其強大的算力。據數據披露,ChatGPT的總算力消耗約為3640PF-days。
簡單來説,ChatGPT就是高質量的人工標註數據再加上強化學習結合的產物,ChatGPT在經過萬億級別的語料投餵後不斷進行學習和迭代,最後依託於強大的算力為產品的學習和輸入輸出進行支撐。

**因此,對於中國的互聯網科技公司來説,誰更有積累可以去做這件事,**誰就越能搶到ChatGPT的先機。
實際上,國內這樣的大模型非常多,百度、阿里巴巴、騰訊、華為等都有大模型。百度文心模型參數量已經達到2600億,不遜於GPT3.0。百度宣稱今年3、4月份推出類似於ChatGPT的模型,可能首期的應用場景會跟搜索結合,會形成ChatGPT、搜索的雙引擎結合模式,發佈會的demo出來,整體模型的參數量級甚至比GPT3.0大了50%。華為對於“華為在類似 ChatGPT 方向的佈局”也回應稱,公司2020年開始在大模型有佈局,2021年發佈鵬城盤古大模型,是業界首個千億級生成和理解中文自然語言處理大模型。
**在國內頭部科技企業中,****相較而言,****百度在“類ChatGPT”項目中會有比較大的優勢:**首先,在國內互聯網企業中,百度對人工智能的佈局最多;其次,百度的中文語料庫最全;第三,ChatGPT所使用的人工智能聊天技術對百度來説是“生命線”,百度必然也會在這方面投入最大,正如谷歌搜索一不小心就會被微軟投資的ChatGPT超車,因此,百度在這方面也是最在意的。
不過,相較於ChatGPT的母公司OpenAI來説,OpenAI還具有所有互聯網科技大廠都不具有的優勢,那就是專注。就訓練大模型來説,幾百億的參數或者幾千億的參數,甚至幾萬億的參數,都需要面對複雜的工程化的問題,需要不斷地謹慎地細緻地耐心地去調模型,去優化模型,這個工作是很漫長的。
打個比方,如果我們要去生產訓練這樣的一個大模型,可能只需要一個月的時間來生產**,卻需要一年的時間去優化它****,這個過程會大量耗費算力和時間,這種調參也被行業人士戲稱為“煉丹”****。**並且,調整和優化的過程,還需要耗費高昂成本。這對於互聯網科技巨頭來説,也是十分困難的事情,以百度為例,這些年,從人工智能、自動駕駛、新能源汽車、元宇宙,到現在的ChatGPT,百度的佈局一個概率都沒落下,但卻也沒有一個真正的產品或事情幹出來。
因此,想要搶到ChatGPT的先機,必然需要多方面因素的疊加下,除此之外,還要摒棄雜念,專注於類ChatGPT的研發,精工出成果。