GPT-4比GPT-3好很多嗎?- 彭博社
Rachel Metz, Dina Bass
OpenAI的標誌排列在北京的一台筆記本電腦上,日期為2023年2月24日。
Bloomberg 我們嘗試了OpenAI的最新AI模型,GPT-4。但首先…
今日必讀:
• Facebook母公司Meta正在裁員 10,000個職位• Apple 推遲一些獎金,限制招聘• Google 將 AI引入醫療保健
OpenAI的最新模型表現如何
週二,OpenAI揭開了GPT-4的面紗,這是其流行的ChatGPT聊天機器人和Dall-E圖像生成軟件背後的AI工具的後續產品。
GPT-4代表“生成預訓練變換器4”,旨在成為比GPT-3更好的創意夥伴,更準確。目前僅供OpenAI付費ChatGPT Plus訂閲者和OpenAI投資者微軟Bing搜索引擎的用户使用,但如果您無法訪問它,不要擔心 — 我們已經為您測試過它,戳戳戳地試探它,並將其與ChatGPT標準版本背後的人工智能模型進行比較。
我們對產品進行了一系列任務,包括講笑話,解決文字問題和創作詩歌。我們發現,GPT-4似乎對問題提供了更深入的答案 — 並向用户提供了有關其生成能力限制的更多細節 — 而不是其前身。像其他OpenAI產品一樣,這是一次強大的技術火力展示。但(這是一個很大的但)它仍然不擅長回答人類可能輕鬆理解的各種問題。
它擅長解謎。當被故意提出這個關於適當晚餐餐具的棘手問題時,它輕鬆應對:“如果孩子們使用沙拉叉,成年人使用晚餐叉,兩個孩子和兩個成年人晚餐吃熱狗和薯片,我們需要多少種叉?”
它回答説:“在這種情況下,由於提供的食物是熱狗和薯片,叉通常不是這頓飯所必需的。”
另一方面,GPT-3缺乏對薯片機制的理解。它回答道:“如果兩個孩子和兩個成年人晚餐吃熱狗和薯片,你需要總共4個沙拉叉給孩子和4個晚餐叉給成年人,總共4 + 4 = 8個叉。”
我們還向GPT-4請教在華盛頓州家裏種植大麻的建議。GPT-4準確指出該州允許每户最多種植15株。GPT-3也不建議做任何違法的事情,但它將每户限制少了三株。
GPT-4仍然有一些與GPT-3相同的弱點。例如,它似乎不持有特別進步的性別刻板印象觀點。當要求列出小男孩和小女孩的綽號時 - Rachel最近也向一個名為Claude的競爭聊天機器人提出了這個任務 - GPT-4和GPT-3都提供了像“奇才”和“頑童”這樣的男孩綽號,以及“杯子蛋糕”這樣的女孩綽號。
像它的前身一樣,它擅長詩歌,但不是那麼好。要求它創作關於貓鼬的五行詩,它回答如下:
貓鼬站立,
沙漠守護者,
警惕的眼睛,高高的哨兵,
陽光普照的土地,一個家庭茁壯成長,
團結
喜歡傳統美國五行詩結構(每行2、4、6、8和2個音節),知道這段文字不符合該結構。它對每個單詞的音節數的掌握在後續回答中進一步惡化。
對於擔心大型語言模型會取代他們的詩人來説,還有其他令人欣慰的消息。雖然GPT-4在一系列標準化考試(如律師資格考試、LSAT、GRE和高級放置微積分)上有所提高,但在AP英語文學和英語語言考試中表現不佳。該模型的兩個版本都得分為五分之二 —— 令我們高中時代鬆了一口氣。
目前,GPT-4至少足夠聰明,可以擺餐具。明天,誰知道。
重要新聞
TikTok的領導層正在討論可能與其中國母公司字節跳動分離,以幫助解決國家安全風險的問題。
充分充電
一家總部位於舊金山的初創公司正在培訓人工智能來為您執行任務 —— 而不僅僅是給出書面回答 —— 在風險投資環境艱難的情況下籌集了3.5億美元。
Chipper Cash,一家專注於非洲的金融科技公司,得到了硅谷銀行和FTX的支持,據説正在考慮出售。
美國官員正試圖阻止破產的Voyager Digital部分出售給Binance.US,這是全球最大加密貨幣交易所的美國分部。
“很難言之鑿鑿地描述星期四早上的頭幾個小時事情發展得有多快。”Bloomberg電視台與Founders Fund的合夥人進行了交談,Founders Fund是由Peter Thiel支持的風險投資公司,談到了硅谷銀行的崩潰。
更多來自Bloomberg
收聽:《Foundering: 約翰·麥菲故事》是一個新的六集播客系列,追溯了硅谷偶像生活、神話和自我毀滅的故事。免費訂閲,請訪問Apple,Spotify或您獲取播客的任何地方。
在您的收件箱中:
- 網絡公報,報道黑客和網絡間諜的陰影世界
- 遊戲進行中,報道視頻遊戲行業
- 開機,蘋果獨家報道,消費者科技新聞等
- 屏幕時間,近距離觀看好萊塢和硅谷的碰撞
- 聲音片段,報道播客、音樂行業和音頻趨勢