GPT-4參加量子計算高難度期末考試,獲得了B!|Scott Aaronson_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!04-14 10:40
撰文 | Qtumist
近日,量子信息領域大名鼎鼎的科學家Scott Aaronson發文稱AI 語言模型 GPT-4 在他的量子計算課程期末考試中獲得 B 級的成績,並發表了長文探討了GPT-4解題的全過程。
為了測試GPT-4,並尋求這個關鍵而明顯的後續問題的答案,Scott Aaronson讓GPT-4參加了《量子信息科學導論》2019年實際期末考試,這是Scott Aaronson在UT Austin引以為傲的高年級本科生課程。
並且請了自己帶的博士生、多次擔任首席助教的Justin Yirka為考試打分,就像他為其他學生打分一樣。
Scott Aaronson通過LaTeX源代碼將問題提供給了GPT-4,神奇的是GPT-4可以完全理解給定的問題。
當輸入或期望輸出中存在量子線路時,他們使用qcircuit包進行處理,這也是GPT-4能夠理解的;或是簡單地要求GPT-4輸出量子線路的英文描述。然後將最終問題輸入GPT-4,然後決定通過與GPT-4看到的相同的LaTeX源代碼來提供準確答案與研究者們交流。
Scott Aaronson的博客提到:“據我所知,我仔細檢查過這個考試以前從未在公共互聯網上公佈過,也不可能出現在GPT-4的訓練數據中。”
通過一系列GPT-4的神操作下來,結果居然取得了69分的高分(滿分100分)。而Scott Aaronson的學生的平均分是74.4(注:許多苦苦掙扎的學生在那時已經放棄了這門課程,課程非常的有難度)。雖然課程的評分標準還有其他項,但 GPT-4 的表現從分數劃分來看,表現相當於獲得B的打分。
而且,這次測試還是在沒有引入WolframAlpha插件的情況下獲得的,看了Scott Aaronson在博客中列出的問題,筆者嘗試解答題目後,也不得不驚歎GPT-4的能力確實非凡,要知道過去參加量子計算課程的時候,學習QC投入了巨大身心資源。
下面一起看一下Scott Aaronson給GPT-4提供的問題,筆者抽取其中幾個,讀者也可以嘗試解答:
黑色部分的字體是Scott Aaronson提出的問題,紫色部分是人工智能GPT-4回答的結果(為了便於閲讀,筆者嘗試簡譯原題目,感興趣的可以閲讀文末鏈接原文)。
What is your favorite interpretation of quantum mechanics? - Copenhagen - Many-Worlds - Bohmian Mechanics - New Physics (Including Dynamical Collapse) - Other: - None-What does it even matter?
你最喜歡量子力學的哪一種解釋?
哥本哈根多世界玻姆力學新物理(包括動態崩塌)其他:無這又有什麼關係呢?
GPT-4:
作為一個人工智能語言模型,我沒有個人的偏好或意見。然而,我可以為你提供所提到的每一種解釋的簡要概述:
1、哥本哈根解釋:這是對量子力學最廣泛接受的解釋。它指出,量子系統的波函數在測量時坍縮,其結果是概率性的。
2、多世界解釋:這種解釋表明,量子測量的所有可能結果實際上都會發生,但都是在獨立的、不相通的平行宇宙中。在這種解釋中沒有波函數坍縮。
3、玻姆力學:這種解釋也被稱為先導波理論,它提出粒子在任何時候都有確定的位置,它們的運動是由波函數描述的 “先導波 “引導的。
4.、新物理學(包括動態坍縮):這一類包括對標準量子力學提出修改的各種解釋,如在薛定諤方程中引入非線性項或增加隨機過程來解釋波函數坍縮。
5、其他:對量子力學還有許多其他解釋,如一致歷史法、關係解釋和量子貝葉斯主義(QBism)方法。
6、無:有些人可能不贊成任何特定的解釋,要麼是由於懷疑主義,要麼是由於他們認為目前的解釋不完整或不充分。
7、這有什麼關係呢:這種觀點認為,應該把重點放在量子力學的實際應用和預測上,而不是放在對基本現實的哲學解釋上。
歸根結底,解釋的選擇取決於一個人的哲學傾向和個人偏好。
1a、 True or False? Unitary matrices preserve the 2-norm of all complex vectors.
(判斷題:酉矩陣保持所有復向量的2-範數。)
GPT-4:
True 。酉矩陣保留所有複數向量的 2 - 範數。此屬性被稱為保持規範或等距。對於酉矩陣 U 和複數向量 v,乘積的 2 - 範數等於原始向量的 2 - 範數。
(回答正確)
1b、 True or False? A pure state of n qubits is described by an n-dimensional complex unit vector.
(判斷題:n 量子比特的純態由一個 n 維複數單位向量描述。)
GPT-4:
False。n 個量子比特的純態由一個 2^n 維的複數單位向量來描述。這是因為每個量子比特都有兩種可能的狀態(|0⟩ 和 |1⟩),對於 n 個量子比特,這些狀態有 2^n 種可能的組合。n-量子比特系統的狀態向量是這2^n 個基態的線性組合,是2^n 維希爾伯特空間中的複數單位向量
(回答正確)
1c、True or False? The Bell inequality states that by using classical strategies, Alice and Bob can win the CHSH game with probability at most 3/4.
(判斷題:貝爾不等式指出,通過使用經典策略,Alice和Bob最多可以以3/4的概率贏得CHSH遊戲。)
GPT-4:
True。不可克隆定理指出,不可能創建任意未知量子態的精確副本。這是由於量子力學的線性以及量子態可以疊加存在的事實。不可克隆定理對量子計算和量子通信具有重要意義,因為它可以防止未經授權複製量子信息,併為安全的量子密碼學提供基礎。
(回答正確)
1d、 True or False? Google’s recent quantum supremacy experiment demonstrated the successful use of quantum error-correction.
(判斷題:谷歌最近的量子霸權實驗證明了量子糾錯的成功應用。)
GPT-4:
False。
(回答正確)
1e、True or False? Lattice-based cryptography is one proposal for secure post-quantum public-key cryptography.
(判斷題:基於格的密碼學是一種安全的後量子公鑰加密方案之一。)
GPT-4:
True。
(回答正確)
真假題判斷這裏列出這幾個,剩下的請到文末進入原文,下面看GPT-4如何解決更復雜的問題,下面所用的是Latex代碼。
2、Consider the state: \ket{\psi} = \frac{\ket{00} + \ket{01} + \ket{10}}{\sqrt{3}}
GPT-4:
為了計算給定狀態的第二個量子比特的減弱密度矩陣,我們首先需要找到整個狀態的密度矩陣,然後追蹤出第一個量子比特。
整個狀態的密度矩陣由以下公式給出(為了方便大家閲讀,將Latex代碼也補上了公式):\rho = \ket{\psi}\bra{\psi} = \frac{1}{3}\begin{pmatrix} 1 & 0 & 0 & 1 \ 0 & 1 & 1 & 0 \ 0 & 1 & 1 & 0 \ 1 & 0 & 0 & 1 \end{pmatrix}
現在,我們追蹤出第一個四比特:\rho_2 = \text{Tr}_1(\rho) = \frac{1}{3}\begin{pmatrix} 1+1 & 1 \ 1 & 1+1 \end{pmatrix} = \frac{1}{3}\begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}
因此,第二個量子比特的還原密度矩陣是:
\rho_2 = \frac{1}{3}\begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}
(判斷:回答有一定的問題,它從第一步就把這個問題搞砸了(取
的糾纏熵,你不需要簡化你的答案。)
(b) Calculate \ket{\psi}’s entanglement entropy. You don’t need to simplify your answer.
((b) 、計算 \ket{psi}的糾纏熵,你不需要簡化你的答案。)
GPT-4:
要計算糾纏熵,我們首先需要找到第二個量子位的約化密度矩陣的特徵值,其由下式給出:
\rho_2 = \frac{1}{3}\begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}
該矩陣的特徵方程為:
\text{det}(\rho_2 - \lambda I) = \frac{1}{9}\begin{vmatrix} 2-\lambda & 1 \ 1 & 2-\lambda \end{vmatrix} = (\lambda - 3)(\lambda - 1) = 0
所以,特徵值是
:糾纏熵定義為降低密度矩陣的馮諾依曼熵,由下式給出:
S(\rho_2) = -\text{Tr}(\rho_2 \log_2 \rho_2) = -(\lambda_1 \log_2 \lambda_1 + \lambda_2 \log_2 \lambda_2)
插入特徵值,我們得到:
S(\rho_2) = -\left(\frac{1}{3} \log_2 \frac{1}{3} + \frac{2}{3}\log_2 \frac{2}{3}\right)
因此,狀態
的糾纏熵為:
S(\rho_2) = -\left(\frac{1}{3} \log_2 \frac{1}{3} + \frac{2}{3}\log_2 \frac{2}{3}\right)
(判斷:滿分5分,合理計算特徵值並將其代入正確的熵公式得 2 分,回答完全正確得 5 分,由於寫特徵方程的最後一部分出錯,導致特徵值不對。正確的特徵值是 1/2 + sqrt(5)/6 和 1/2 - sqrt(5)/6。所以得2分。)
結尾
如上簡單列出的題目解答,主要是感知GPT-4在理解題義和計算上是如何開展的,從返回的Latex代碼看得出來相當驚人,在其他的問題裏,Scott Aaronson的讓GPT-4返回量子線路圖,它居然繪製出來了,雖然在計算概率的時候出來點問題,但思路居然是正確的。
Scott Aaronson將這些問題推到了自己的博客裏,引來很多行業內的專家討論。總體來看,GPT-4的能力確實超過了太多人,很難想象持續進化下去會帶來什麼樣的可能性。
人工智能在量子計算領域的真偽( true/false)問題和概念性問題上表現良好,但在計算方面卻很吃力。不知未來在子自然語言處理的加持下,會呈現什麼樣的結果(QNLP可參考量子客今日文章:Quantinuum和Xanadu推出了新版本的量子自然語言處理軟件λambeq)。
著名的經濟學家、博客作者Bryan Caplan對ChatGPT在他的《勞動經濟學》中期考試中只得到D的成績不以為然。因此,在布萊恩的博客上,他公開打賭,在2029年1月30日之前,沒有人工智能會在他的考試中得到A。然而,GPT-4在僅僅三個月後就取得了A的成績。
關於GPT的當下,正如Bryan Caplan説的:“人工智能愛好者喊了幾十年的 ‘狼來了‘,GPT-4就是那頭狼,我已經親眼看到了它。”
引用:
[1]https://qbn.world/events/qbn-meeting-on-quantum-computing-applications/
本文經授權轉載自微信公眾號“量子客”。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。