Chat-GPT 可以做數學嗎?_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!01-25 13:31
撰文 | George Shakan
翻譯 | 蔣迅
譯者注:本文試圖説明Chat-GPT在數學證明領域裏還有缺陷。所以下面除了最基本的問題外,Chat-GPT給出的證明都是不正確的。請讀者不要把這裏的證明當作標準答案。
Chat-GPT是Open AI發佈的令人印象深刻的全新AI聊天機器人。它令人印象深刻的應用程序可以在整個互聯網上找到。但它能做數學嗎?
通過數學,我們並不意味着簡單地做一些計算。它自己的設計確保了存在着它無法解決的計算問題。我更感興趣的是它可否解決需要一些數學推理的問題。
為了選擇我們的問題,我們使用了MMLU數據集。Meta AI最近發佈的大型語言模型Galactica在這個數據集上取得了一些不錯的結果。他們的發現陳述在他們論文的第5.3節中。
接下來,我們將挑選幾個問題,看看Chat-GPT如何處理它們。如果失敗,我們將嘗試改寫這個問題以期獲得部分結果。
我們注意到MMLU數據集有多項選擇題,但我們只是將問題呈現給Chat-GPT。我們只是從MMLU的抽象代數部分選擇問題。之後,我們將刺激Chat-GPT以獲得直覺和證明。在最後,我們將向數學家推薦Chat-GPT的一些應用。
問題一
問題二
問題三
但是直覺是什麼?
使研究數學家偉大的是對問題的某種“直覺”。讓我們看看Chat-GPT是否可以解釋其中的任何一個。
我: 你能解釋一下柯西-施瓦茨不等式背後的直覺嗎?請用latex寫所述的數學公式。
我希望這有所幫助!如果你有任何問題,請告訴我。
注: 這還算不錯,但肯定可以改進。例如,解釋什麼時候柯西-施瓦茨不等式何時成立(當一個向量是另一向量的倍數時)有助於給出最後一段更精確的含義。人們可以看到陶哲軒這篇博客文章的前幾段,以瞭解來自世界領先數學家之一的解釋。此外,這是Stackexchange上關於該主題的數學討論。
給出證明
我: 你能證明這個嗎?
Chat-GPT: 當然!這是柯西-施瓦茨不等式的證明:
首先,我們可以將不等式重寫為:
我希望這個能有所幫助!如果你有任何問題,請告訴我。
注: 不幸的是,這個證明並不完全正確。無論是證明方法還是細節(即它對 AM-GM 的應用)都存在嚴重缺陷。
結論
老實説,Chat-GPT對於一個無論如何都不是為數學量身定做的模型來説是相當令人印象深刻的。我認為,以目前的格式,它已經可以幫助數學家準備講義甚至論文中更簡單的部分。也許它最大的用處在於自動處理基金和工作申請的某些部分。
本文經授權轉載自微信公眾號“遇見數學”。
原文鏈接:https://gshakan.wordpress.com/2023/01/02/can-chat-gpt-do-math/
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。