中國科技巨頭鏖戰ChatGPT，誰能搶佔先機？_風聞

根新未来-02-24 10:11

2023-02-24

文/觀察未來科技

本質上來看，ChatGPT就是一種基於 InstructGPT算法架構開發的大型預訓練語言模型，都是基於大模型、大數據的不斷訓練。ChatGPT的背後，除了常規的萬億級別語料投餵之外，還依託於其強大的算力。據數據披露，ChatGPT的總算力消耗約為3640PF-days。

簡單來説，ChatGPT就是高質量的人工標註數據再加上強化學習結合的產物，ChatGPT在經過萬億級別的語料投餵後不斷進行學習和迭代，最後依託於強大的算力為產品的學習和輸入輸出進行支撐。

**因此，對於中國的互聯網科技公司來説，誰更有積累可以去做這件事，**誰就越能搶到ChatGPT的先機。

實際上，國內這樣的大模型非常多，百度、阿里巴巴、騰訊、華為等都有大模型。百度文心模型參數量已經達到2600億，不遜於GPT3.0。百度宣稱今年3、4月份推出類似於ChatGPT的模型，可能首期的應用場景會跟搜索結合，會形成ChatGPT、搜索的雙引擎結合模式，發佈會的demo出來，整體模型的參數量級甚至比GPT3.0大了50%。華為對於“華為在類似 ChatGPT 方向的佈局”也回應稱，公司2020年開始在大模型有佈局，2021年發佈鵬城盤古大模型，是業界首個千億級生成和理解中文自然語言處理大模型。

**在國內頭部科技企業中，****相較而言，****百度在“類ChatGPT”項目中會有比較大的優勢：**首先，在國內互聯網企業中，百度對人工智能的佈局最多；其次，百度的中文語料庫最全；第三，ChatGPT所使用的人工智能聊天技術對百度來説是“生命線”，百度必然也會在這方面投入最大，正如谷歌搜索一不小心就會被微軟投資的ChatGPT超車，因此，百度在這方面也是最在意的。

不過，相較於ChatGPT的母公司OpenAI來説，OpenAI還具有所有互聯網科技大廠都不具有的優勢，那就是專注。就訓練大模型來説，幾百億的參數或者幾千億的參數，甚至幾萬億的參數，都需要面對複雜的工程化的問題，需要不斷地謹慎地細緻地耐心地去調模型，去優化模型，這個工作是很漫長的。

打個比方，如果我們要去生產訓練這樣的一個大模型，可能只需要一個月的時間來生產**，卻需要一年的時間去優化它****，這個過程會大量耗費算力和時間，這種調參也被行業人士戲稱為“煉丹”****。**並且，調整和優化的過程，還需要耗費高昂成本。這對於互聯網科技巨頭來説，也是十分困難的事情，以百度為例，這些年，從人工智能、自動駕駛、新能源汽車、元宇宙，到現在的ChatGPT，百度的佈局一個概率都沒落下，但卻也沒有一個真正的產品或事情幹出來。

因此，想要搶到ChatGPT的先機，必然需要多方面因素的疊加下，除此之外，還要摒棄雜念，專注於類ChatGPT的研發，精工出成果。