中國百度開發自己的ChatGPT,加入全球AI競賽 - 華爾街日報
Karen Hao and Raffaele Huang
中國的百度公司已投身於一場全球競賽,旨在將新一代人工智能技術如ChatGPT商業化,這些技術可能徹底改變互聯網。
該公司正在開發一款類似OpenAI旗下熱門產品ChatGPT的AI聊天機器人,並計劃於三月將其整合至核心搜索引擎中,知情人士透露。
此舉將使總部位於北京的百度成為全球少數擁有自主版本該技術的科技企業。這項技術已引發消費者和企業的廣泛關注,並對現有企業施加壓力,促使它們開始調整產品開發戰略。
百度有望成為首個向中國消費者提供該技術的企業。在中國,互聯網受到國家審查且ChatGPT的訪問受到限制。
百度制定計劃之際,華盛頓與北京之間圍繞提升各自國家在戰略新興技術領域領導地位的競爭正日趨激烈。
這也凸顯了人工智能研究流動、跨境的本質——開源是這一領域的常態。據部分知情人士稱,OpenAI構建ChatGPT的核心突破基於Alphabet旗下谷歌2017年開發的算法,百度同樣採用了該算法並作為其聊天機器人的技術基礎。
據《華爾街日報》看到的百度內部網站記錄顯示,百度首席執行官李彥宏在12月下旬向部分員工發表的講話中提及ChatGPT,稱其代表着新的機遇。
“我們擁有如此酷炫的技術,但能否將其轉化為人人需要的產品?“李彥宏在提及包括聊天機器人在內的人工智能驅動技術時説道,“這實際上是最困難的一步,但也是最偉大、最具影響力的。”
彭博社早前報道過百度的相關計劃。
百度的發展速度一直未能跟上中國其他互聯網同行的步伐,該公司一直致力於轉型為人工智能企業,在包括自動駕駛汽車和專為人工智能應用提供動力的芯片等技術上投入了數十億美元。
利用其搜索引擎業務積累的海量文本數據,百度特別專注於人工智能研究的一個領域——自然語言處理。該領域在過去幾年取得了重大突破,並推動了包括ChatGPT在內的人工智能技術近期的爆發式增長。
2019年,百度基於谷歌的突破性技術開發了名為"文心”(Ernie)的深度學習模型,用於改進其搜索結果,使其更具相關性。此後,該公司又開發了數十個文心模型,並將其功能擴展到包括圖像和藝術生成,類似於OpenAI的Dall-E。
百度CEO李彥宏向員工表示,重大挑戰在於將公司的"酷炫技術"轉化為人人需要的產品。圖片來源:吳紅/Shutterstock據知情人士透露,百度正以文心大模型(Ernie)作為其聊天機器人的基礎,並同時在中國防火牆內外使用中英文資料進行訓練。根據其開源研究論文,百度過去曾利用維基百科、BookCorpus、Reddit以及百度百科、百度新聞等自有產品生態訓練文心大模型。
一位知情人士表示,百度計劃按照國家內容審核規則限制聊天機器人的輸出。OpenAI同樣對ChatGPT的輸出施加限制,以避免有害仇恨言論和政治敏感話題。
行業研究人員指出,基於海量互聯網文本數據訓練的ChatGPT能以流暢對話形式回答各類用户問題,但無法保證答案准確性,有時會產生性別歧視或種族主義言論。
包括微軟和谷歌在內的科技巨頭正加速完善ChatGPT底層技術,並將其整合至搜索引擎等產品中——其對話能力被認為最有可能顛覆現有格局。
據《華爾街日報》報道,2019年及2021年投資OpenAI的微軟宣佈追加高達100億美元投資,將ChatGPT整合至必應搜索引擎等產品線。
谷歌的一項類似技術LaMDA於2021年首次亮相,Meta Platforms公司也在2020年發佈了名為BlenderBot的聊天機器人,但兩者均未透露將這些技術整合到其平台的計劃。
聯繫Karen Hao,郵箱:[email protected];聯繫Raffaele Huang,郵箱:[email protected]
本文發表於2023年1月31日印刷版,標題為《中國百度加入全球AI競賽,開發自己的ChatGPT》。