科技公司尋求增長之際,ChatGPT熱潮席捲中國——《華爾街日報》
Karen Hao and Shen Lu
ChatGPT的病毒式流行在中國掀起熱潮,在經歷兩年監管整頓和新冠疫情的衝擊後,科技公司一直在尋找新的增長來源。
搜索引擎運營商百度、電商巨頭阿里巴巴集團以及社交媒體巨頭騰訊控股等企業已宣佈投資開發自己的同類產品,以對標這款未在中國開放的人工智能聊天機器人。其他中國公司近期股價因跟風炒作而暴漲,引發官媒對投機性上漲發出警告。
AI和中國科技行業專家表示,早期投資生成式AI技術的中國企業目前最有條件打造自己的ChatGPT,這類技術能像人類一樣生成文字、圖像和藝術作品。但更多企業正競相追趕美國同行在最新技術發展和商業應用方面的步伐。
儘管中國擁有多家領先的AI企業,但多數聚焦於計算機視覺及監控等應用領域。ChatGPT則需要來自自然語言處理這一不同子領域的技術儲備。
中國企業還面臨地緣政治和審查相關障礙,包括獲取受美國出口管制的先進芯片,以及應對中國政府嚴格的內容審查規定。
儘管如此,具備技術實力的企業將成為快速跟進者。卡內基國際和平基金會研究員馬特·希恩表示,對於這類企業而言,“中國要追趕並重建甚至開發出更優模型,並不存在實質性障礙”。
ChatGPT的開發者OpenAI禁止中國用户註冊聊天機器人賬號,但許多人已通過虛擬專用網絡或花費幾美元在電商平台購買賬號繞過限制。ChatGPT能生成中文回答,其驚豔、出人意料時而出錯的回應成為中國社交媒體熱議話題,部分消費者開始呼籲推出國產替代品。
今年1月傳出百度相關計劃,該公司擬於3月將自研AI聊天機器人"文心一言"整合至搜索引擎。百度週三表示還將利用該技術優化百度智能雲、自動駕駛系統及小度語音助手。
百度CEO李彥宏在分析師電話會議中表示,公司將向公眾開放大語言模型並提供商業服務。他透露已有機構決定將文心一言集成至其產品服務中。
隨後騰訊(微信母公司)、電商巨頭京東、語音識別公司科大訊飛相繼表態——儘管均未公佈具體方案。遊戲公司網易稱正探索將ChatGPT底層技術應用於教育產品。外賣平台美團聯合創始人王慧文雖自稱技術瞭解有限,仍宣佈計劃投資5000萬美元打造"中國版OpenAI"。
阿里巴巴是最早開發自有中文大語言模型的公司之一,這類模型正是ChatGPT的技術基礎。圖片來源:沈來來/彭博新聞ChatGPT的基礎是所謂的大語言模型,該模型通過海量語言數據進行訓練。此類模型可用於一系列商業應用,從改進搜索結果、驅動語音助手到自動化內容審核。
在中國,百度和阿里巴巴是最早開發自有中文版本的公司。百度於2019年發佈了名為"文心一言"的模型,隨後與谷歌和OpenAI的發展同步推進,並用於優化其搜索引擎。同年阿里巴巴推出了"AliceMind",兩年後又發佈了"M6"。“AliceMind"為阿里客服聊天功能"阿里小蜜"提供技術支持。
電信巨頭華為技術有限公司、IT綜合企業浪潮集團,以及政府支持的北京智源人工智能研究院和中國科學院,也都研發了各自的版本。
中國企業現在正是依託這些基礎模型向類ChatGPT產品演進。但專家表示,只有少數公司能快速實現這一目標。
原因之一是中國企業獲取多樣化數據的渠道較為有限。ChatGPT基於當今最大的語言模型之一——OpenAI的GPT-3.5,該模型受益於全球互聯網上涵蓋多學科領域的海量英文數據。而中文數據不僅總量較少,在國內還面臨嚴格的內容審查控制。
搜索引擎運營商百度計劃將自研AI聊天機器人整合至搜索引擎中。圖片來源:沈啓來/彭博新聞香港科技大學人工智能研究中心主任馮雁表示,除公開數據外,多數中國企業僅掌握金融或電商等特定領域的文本及對話數據。她指出,百度因通過搜索引擎爬取網絡數據而擁有獨特優勢。
美國對高端芯片的出口管制可能構成另一重挑戰。最新研究顯示,過去兩年中國開發的大多數大型語言模型均基於美國製裁的英偉達A100圖形處理器訓練完成。喬治華盛頓大學研究技術變革的政治學者、該論文合著者丁傑弗裏指出,一旦企業耗盡高端芯片庫存,技術發展速度或將放緩。
中國嚴格的審查與監管環境將從其他方面制約發展。ChatGPT曾出現傳播錯誤信息或生成怪異冒犯性內容的問題。中國科技專家表示,本土企業面臨更大壓力,需確保其聊天機器人不會對政治敏感話題過度發揮。
hello earth
你好,
世界,
你好地球