OpenAI推出聊天機器人ChatGPT新版GPT-4——《華爾街日報》
Deepa Seetharaman
開發了病毒式傳播聊天機器人ChatGPT的公司於本週二發佈了其人工智能技術的新版本,稱其比之前的版本更強大、更可預測,並且能夠分析圖像和處理更大的文本塊。
OpenAI(一家獲得微軟公司數十億美元支持的初創公司)的這則公告是近期一系列生成式AI公告中的最新動態,各公司正試圖在這場構建和使用這一熱門新技術的競賽中取得領先。
許多監管機構、學者和活動人士敦促科技公司在開發這些尚未經過充分測試的工具時更加謹慎。生成式AI技術之所以特別,是因為它能夠根據基本的語言提示生成原創圖像、文本和其他內容,但有時會產生看似失控的回應,包含捏造的事實或種族主義和性別歧視的言論。
OpenAI表示,在創作歌曲或編寫劇本等任務方面,其更新後的聊天機器人比之前的版本“更具創造性和協作性”。圖片來源:Gabby Jones/Bloomberg News在週二的一篇博客文章中,OpenAI推出了一個更強大的技術版本,稱為GPT-4,這是ChatGPT背後的技術。博客稱,在創作歌曲或編寫劇本等任務方面,更新後的聊天機器人比之前的版本“更具創造性和協作性”。
該公司從週二開始通過數據共享合作伙伴關係推出這項技術,包括摩根士丹利和多鄰國公司等企業付費接入。該技術也將提供給ChatGPT Plus訂閲用户,他們每月支付20美元以獲得更快、更穩定的服務。目前免費用户尚無法使用。
在週二的在線演示中,OpenAI展示了該工具如何用於解釋晦澀的税法條款,或將文章摘要成每個單詞都以Q開頭的句子等任務。
OpenAI表示,其現在能更好地分析圖像信息。例如,用户可以用它掃描食材照片,然後獲得用這些食材製作潛在菜餚的建議食譜。發言人表示,圖像分析功能尚未廣泛推出。
OpenAI總裁兼聯合創始人格雷格·布羅克曼在演示中表示,GPT-4比前代GPT-3.5犯錯更少,但與能核查其工作的人員配合使用時效果最佳。
“它並不完美,但人也不完美,這個增強工具能讓你共同達到新高度。“他説。
當OpenAI在LSAT律師資格考試和統一律師考試等標準化測試中使用最新版本時,其表現遠優於大多數人及前代版本。但公司數據顯示,它在英語語言文學測試中仍存在困難。
在週二正式發佈前已提前測試過這款聊天機器人的科技公司高管們表示,OpenAI的最新版本看起來是一次令人印象深刻的升級。
“GPT3或3.5感覺像六年級學生,而4感覺像聰明的十年級學生,“人工智能初創公司Tome的聯合創始人基思·佩里斯説,該公司創建演示工具並一直在測試GPT-4。他表示,新版本可以分析25頁文本,而早期版本只能分析3頁。
奧本海默分析師蒂莫西·霍蘭在一份研究報告中表示,GPT-4在數學和解決問題方面的進步將減少對其準確性的批評。
其他幾家公司最近也宣佈了重大人工智能計劃。微軟已將人工智能集成到其必應搜索引擎中,並計劃在本週概述如何將其引入其最受歡迎的軟件,包括Word、Excel和PowerPoint。
Alphabet Inc.的谷歌在Docs和Gmail服務中引入了一些人工智能驅動的寫作功能,以幫助人們開始寫作。OpenAI的競爭對手Anthropic也在週二更廣泛地推出了其聊天機器人Claude。
微軟已將人工智能集成到其必應搜索引擎中,並預計將概述如何將其引入其Word和Excel軟件。照片:Chona Kasinger/彭博新聞自OpenAI去年向公眾發佈其圖像生成技術Dall-E 2以來,科技公司一直在炒作生成式人工智能的可能性。Dall-E 2可以根據簡單的提示創建原始圖像。它在11月發佈了ChatGPT,允許數百萬人使用它來生成從商業計劃到打油詩的一切內容。
人工智能分析師警告稱,生成式AI仍存在潛在問題。雖然ChatGPT等文本生成器在已獲取高質量信息的主題上表現準確,但在其他話題中,它們可能輸出帶有種族主義、性別歧視的答案,以及錯誤信息和陰謀論內容。
ChatGPT的運行成本較高且響應速度較慢。首批測試AI版必應的用户曾收到邏輯混亂的回覆和事實性錯誤。微軟此後已對搜索引擎及其使用規則進行更新,試圖改善結果。
OpenAI在博客中表示,GPT-4的開發諮詢了50多位AI、安全領域的專家,並指出相比GPT-3.5,GPT-4對"違禁內容"請求的響應概率降低82%,返回準確答案的概率提高40%。
加州大學伯克利分校專攻國際商業與信息安全的史蒂文·韋伯教授認為,這項技術尚未在現實世界廣泛測試,現在評判為時過早。
“正如我們此前版本所見,其實際應用表現可能大相徑庭。“他表示。
聯繫記者迪帕·西塔拉曼,郵箱:[email protected]