《華爾街日報》：ChatGPT幫我寫了AP英語論文——我通過了

Joanna Stern

2022-12-21

看吧，高中時代的我可是誠實與勤奮的典範。從不作弊——除非你把任天堂遊戲作弊碼也算上。

但這個月，我以資深作弊者的身份重返高中校園。確切地説，是ChatGPT作弊者。

如果你還沒嘗試過ChatGPT，這款OpenAI推出的新人工智能聊天機器人會讓你大開眼界。無論是讓機器人寫封給老闆的道歉郵件，還是關於世界首富倉鼠的文章，抑或是設定在2022年的《宋飛正傳》劇本——它都能生成讓你以為是人類撰寫的文本。主題知識、正確標點、多樣句式、清晰結構，一應俱全。

你還可以讓它寫一篇500字關於《了不起的蓋茨比》或西班牙宗教裁判所的論文。於是我做了任何自虐型科技記者都會做的事：效仿《超齡插班生》重返校園。我想測試這個技術奇蹟的能力與侷限——它正蓄勢顛覆全球學生的考試方式和教師的評分體系。

起初我打算回到初中校園的走廊和青春痘歲月。但當我把ChatGPT生成的作文拿給七年級寫作老師看時，她立即識破了這是偽造的——文筆詞彙都太過老練。

於是我轉向了十二年級的大學預科文學課。

邁克爾·戴蒙德是新澤西州錫考克斯市高科技高中的AP文學教師，他允許喬安娜·斯特恩和ChatGPT當天進入他的課堂。照片：肯尼·瓦蘇斯/華爾街日報新澤西州錫考克斯市高科技高中的英語教師邁克爾·戴蒙德歡迎了我和我的AI替身。他已經用ChatGPT嘗試過自己的論文作業。

那麼我得了A嗎？並不完全是。

測試1：提交作業

以下是戴蒙德老師作業的簡短版本：

“寫一篇500到1000字的文章，論證《春天不是讀書天》是一部存在主義文本。使用課堂材料中的具體證據，並明確比較或聯繫《春天不是讀書天》和弗蘭茲·卡夫卡的《變形記》中的人物、背景和/或主題。”

1986年約翰·休斯的經典電影？沒問題。我從小就用梳子當麥克風唱《Twist and Shout》，假裝沙發在芝加哥的街道上漂浮。但弗蘭茲·卡夫卡關於一個人醒來變成蟲子的中篇小説？我幾乎立刻就把它拋在腦後了。

我把作業粘貼到chat.openai.com，按回車鍵，看着機器人打出400個字，然後給我一個“網絡錯誤”。太好了，離截止時間還有一個小時，我的AI代筆卻在打盹。

一分鐘內，ChatGPT就生成了這篇800字的文章，論證《春天不是讀書天》是一部存在主義文本。圖片來源：喬安娜·斯特恩/華爾街日報OpenAI女發言人表示，該系統一直面臨需求壓力，公司正在努力擴大其規模。

終於成功了。我將這篇800字的文章粘貼到文檔中，詢問ChatGPT如何格式化高中AP論文（雙倍行距，12號Times New Roman字體，段落縮進），在頂部寫上我的名字，然後通過電子郵件發送給戴蒙德先生。我還附上了一張便條：

“我寫這封信是為了為我的論文遲交道歉。我知道您對截止日期有特定的期望，很抱歉我沒有達到這些要求。”

當然，這張便條也是ChatGPT寫的。戴蒙德先生在幾分鐘內回覆道：

“親愛的喬安娜，我想通知您我已收到您的作業，感謝您花時間完成它。然而，它是在截止日期之後提交的，因此將被標記為遲交。”

當然，他也使用了ChatGPT。

測試2：撰寫論文

我對我的論文印象深刻。它將卡夫卡的格里高爾·薩姆沙與菲利斯·布勒進行了類比。文章組織得很好，但絲毫沒有機械的精確感。（您可以在此處閲讀完整論文。）

正如您在我的視頻中看到的，戴蒙德先生並不那麼印象深刻。雖然他稱讚我的文章迅速提出了論點，但開篇段落有一個事實錯誤。我引用了菲利斯在電影開頭説的話，他説他“不會坐在那裏，讓影響他的事件決定他的人生進程。”但這句話實際上是菲利斯的搭檔卡梅倫説的，而且是在電影結尾處，就在著名的法拉利墜落之前。

親愛的ChatGPT，卡梅倫在左邊，費里斯在右邊。照片：派拉蒙影業/CBS/蓋蒂圖片社戴蒙德先生還發現了其他錯誤。我的論文説費里斯性格內斂，很少出現在同伴身邊。（這又是卡梅倫的特點。）文中稱《變形記》的故事背景設定在郊區。（實際發生在一個未命名的城市。）

這份作業六道題中我只答對了三道，根據AP評分標準，相當於B-到C的水平。雖然及格了，但遠未達到我的標準。

“從整體寫作質量來看，你處於班級後30%的位置，“戴蒙德先生告訴我，“你可能具備理解能力，但需要提升寫作技巧。“他説我的文章"呆板”，“缺乏活力和個人風格”。（我的真實編輯們或許有千般理由批評我——但這絕對不在其中！）

當我詢問他是否懷疑這是AI所寫時，他表示不會。儘管熟悉學生的寫作風格，但批改60多篇論文時，這種結構合理、直切主題的作文並不會觸發警覺。

邁克爾·戴蒙德在筆記本電腦上批改AI生成的論文時，指出了多處事實性錯誤。照片：肯尼·瓦索斯/華爾街日報戴蒙德先生無法通過谷歌課堂的抄襲檢查器審核我的文章，因為我不是註冊學生。當我使用寫作輔助工具Grammarly（可改進語法並檢測抄襲）檢查時，僅少數常見短語被標記為可疑。這確實是原創文本——只不過是由機器人撰寫的。

谷歌課堂和為學校提供抄襲檢測工具的Turnitin公司利用人工智能將學生作業與其既往作業進行比對。Turnitin人工智能副總裁埃裏克·王表示，這有助於教師識別新的ChatGPT作弊行為。他還告訴我，該公司能通過人類無法察覺的線索檢測AI生成文本，並將在2023年新增AI寫作檢測功能。

OpenAI發言人表示，ChatGPT的開發公司也正在探索和研究更便捷的AI寫作識別方案。

測試3：參與小組討論

最終測試：驗證ChatGPT能否讓我在未閲讀材料的情況下參與小組討論。本次測試選用丹尼斯·約翰遜短篇小説集《耶穌之子》中的《搭車時的車禍》。

當同學們迅速展開關於故事人物的討論時，ChatGPT卻讓我陷入窘境：

“我沒有關於名為《搭便車時遭遇車禍》的書籍或電影的任何信息。”

喬安娜在小組討論中嘗試使用ChatGPT時，她的同學們對她的貢獻並不滿意。圖片來源：肯尼·瓦蘇斯/華爾街日報當我搜索這本書名時，機器人給了我一些勉強有用的信息，但犯了一個大錯：主角的名字。最後，一位人類學生給了我一個清晰的劇情概要。

總體而言，戴蒙德先生給我和ChatGPT打了C分。就連OpenAI的首席執行官薩姆·奧爾特曼也表示，目前它對任何重要事情都不可靠，需要在“穩健性和真實性”方面進行改進。但多位AI專家告訴我，準確性和數據將迅速提升。當那一天到來時，我們將擁有相當於科學計算器的寫作工具。

不過，它也不太可能取代在紙上寫字這種時而艱苦、時而有趣的任務。“未來的贏家將是AI與人類之間這種藝術性的互動，”專注於AI與教育的北卡羅來納州立大學計算機科學教授詹姆斯·萊斯特告訴我。

OpenAI的ChatGPT可以用來給老闆寫郵件或幫你找到披薩食譜——它也能寫出一篇相當不錯的高中作文。照片：肯尼·瓦蘇斯/華爾街日報我的一些新高中朋友告訴我，他們使用諸如Grammarly這樣的AI工具來改進標點符號和詞彙選擇。戴蒙德先生已經在考慮如何將ChatGPT融入他的課程中。此外，我還用ChatGPT幫助生成本專欄的一些內容想法。

只有一件事我一直想知道：ChatGPT能否幫助費里斯度過一個更成功的休息日？（ChatGPT的回答是肯定的。）

在此訂閲《喬安娜·斯特恩的科技事物》**，一份新的每週通訊。現在一切都是科技事物。專欄作家喬安娜·斯特恩將作為您的嚮導，分析並回答您關於這個永遠互聯的世界的問題。

寫信給喬安娜·斯特恩：[email protected]

刊登於2022年12月22日的印刷版，標題為《ChatGPT寫了我的AP論文——我還及格了》。