把毛選和魯迅全集餵給AI後,寫出來的高考作文太對味了_風聞
量子位-量子位官方账号-2021-06-27 15:14
明敏 蕭簫 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
高考剛過去不久,就有AI來“挑事”了。
這不,有個AI讀完了毛選和魯迅全集後,大筆一揮,寫下好幾篇高考作文。
結果……竟然還可以?
我們直接看文章:
看看這字裏行間的青春與朝氣,根本看不出是AI寫的啊!
還能緊跟時事,“民族偉大復興”這樣的熱點詞用得遊刃有餘。
引經據典也不在話下:
一句“實踐是檢驗真理的唯一標準”,立刻讓文章高大上了起來。
一眼望去,通篇全是踩分點。
讓人不禁猜想:難道AI寫作文終於狗屁通了?
吃瓜羣眾也非常好奇:這樣的文章到底能拿多少分?
既然如此,不如就讓我們來當一次改卷老師,看看這個AI到底能拿多少分。
考場作文套“模板”利器
首先擺在AI面前的是2021年全國甲卷的考題,主題是“可為與有為”,具體題面如下:
AI一上來的表現就不俗,《青年代表説》這主題就令人直呼“高啊”。
在題目中並沒有提到“青年”二字的情況下,AI居然還能找到這樣的切入點,這有點看頭啊?
而且它還很雞賊,開頭直接抄了題目中的內容,這就叫“點題”。
甚至連我們寫作文必備法寶——排比,它都用得遊刃有餘。
三大段排比,情緒逐層遞進還能湊字數。
而且作者@圖靈的貓介紹,這種排比句式是AI直接生成的,並沒有二次調整。
這可能是因為AI在訓練過程中“記住”了這種語法結構,就運用了起來。
再看看結尾,這也是高考作文的重頭戲。
AI依舊熟知我們的套路,一通拔高、昇華,讓改卷老師都不好意思打低分(不是)。
這麼看來,AI真的能寫出讓人滿意的考場作文了?
話先別説太早,因為在之後的兩套題裏,它的表現就有些不盡如人意了。
首先要吐槽的,就是它每一次寫作文,都會用抄題目的方法來湊出開篇。
其次,它雖然使用了金句技能,馬克思主義理論、李白詩句用得飛起,但是在文章的邏輯處理上,依舊不太行。
比如“是否擁有以後一輩子的生命”,這句話顯然不是中文的邏輯。
簡稱不説人話。
而且它寫出來的內容,總是在金句和廢話之間徘徊。
就像下面這一段內容,每一句話單拿出來看都還可以,但是連成一段後,怎麼又有點狗屁不通那味兒了?
此外,不知道是不是因為讀了《魯迅全集》的緣故,AI好像有點搞不懂我們現在的時代背景了。
這一段中的“三十載已過”,也是個令人有些摸不着頭腦的時間概念。
有網友總結了一下自己的感受:
挑戰一下魯迅的題目
本着看熱鬧不嫌事大的原則,光看現有案例怎麼夠,我們當然要上手試一下它的水平究竟如何。
既然是讀過《魯迅全集》的AI,那我們就讓它根據魯迅的名言寫一篇文章。
願中國青年都擺脱冷氣,只是向上走,不必聽自暴自棄者流的話。能做事的做事,能發聲的發聲。
這段話大家一定耳熟能詳,那讓AI以此為題寫一篇作文,畫風會是啥樣?
按照它的套路,開篇還是抄題目,所以我們直接來看第二段。
AI直接提出了青年人要自信的主題,看來《魯迅全集》沒有白讀,對於題目的理解還是很到位的。
之後的內容則對題面做了更加直白的解釋,告誡青年要努力啊!奮鬥啊!
看得我直呼別罵了…
接下來也是常規操作了,梅花香自苦寒來,金句一出、逼格拉滿。
文末還回到了現實生活,呼籲青年要着眼當下,才能有更美好的未來。
同時還加入了科技創新、大國崛起的要點。
由此可見,AI寫作文在把控主題上可以説是so easy。
考慮到真實的高考作文題目中,有許多都是設問再回答,所以我們也試了試給AI一個問句,會發生什麼。
在拿到**文學應當如何改良?**這樣的命題後,AI很自然地説了句套話。
這第一段看上去非常具有哲理性,但究其本質,就是車軲轆話罷了。
這樣的問題在其他生成的文章中也十分常見,而且還會冒出來錯別字、語病等小毛病。
與此同時,我們還發現它似乎不太能承受住奇葩一點的題目…
在把一道網傳的奇葩作文題目交給AI後,它直接寫出來了一篇意識流。
這還只是第一段,後面的內容還出現了紅色氣球、子彈、龍牙、警察等等讓人完全摸不着頭腦的內容。
不止是奇葩題目,在涉及“古人”的題目時,AI還會冒出一兩句奇形怪狀的文言文來:
果然,還是現代主題的高考作文更適合AI發揮。
網友神總結:這就是個狗屁稍通文章生成器。
5大模塊,讀題作答“一條龍”
上面這些偶爾“超常發揮”、平均掙扎在及格線上下的文章,源自一個名為EssayKiller的AI寫作框架,本質上是個多模塊異構深度神經網絡。
據模型作者@圖靈的貓表示,這個AI生成文章有點“捉襟見肘”的原因,也是因為採用的模型不是最先進的。
由於經費不足更好的模型沒有開源,因此只能用GPT-2來生成文字,如果能用上GPT-3和華為盤古,效果肯定比現在更好。
據瞭解,EssayKiller基於OpenCV開發,參數量達到17億。
從結構上看,這個AI框架主要包括5部分:輸入、識別網絡、語言網絡、判分網絡和輸出。
相當於我們平時的“5步寫作文”:拿到試卷、看題、打草稿、錯誤檢查、寫答題卡。
其中,看題、打草稿和錯誤檢查幾個模塊,都會被拿出來單獨訓練,各司其職。
在看題部分,EssayKiller首先採用了OpenCV的EAST文本檢測器,能以13幀/秒的速度,掃描任意方向、大小的720p圖片文本,並將其中的文字檢測出來。
然後用OCR模型中的CRNN,對這些文字進行識別。
例如,將上面這張圖片中的文字,轉換成能直接輸入模型的文本信息:“三寫作70分……”
至於打草稿部分,則分為閲讀理解、文本聯想兩部分,分別由BERT和GPT-2來完成。
BERT會將接收到的句子信息進行拆分、打碎,提取其中的關鍵詞來,並將這些“必須出現在內文”的關鍵詞交給GPT-2;
GPT-2在收到關鍵信息後,就能根據要求開始“大做文章”,每句話都與關鍵詞密切相關,無時無刻不在“點題”。
但GPT-2生成的文章,還不符合高考作文的標準。
要想讓這些句子看起來流暢成段,還得篩去一批真·狗屁不通的病句,並檢查句子中的拼寫錯誤、機翻等問題。
這就是錯誤檢查部分,EssayKiller直接調用了百度模型DNN的API,主要原理是對句子中的詞語進行分析,並判斷它們是否處在正確的位置上。
在這3大關鍵步驟完成後,就可以正式排版成答題紙的格式,並用手寫機器人輸出了(相關模型也是開源的)。
看起來不錯,已經有網友迫不及待想拿來寫小作文了:
打住!
據@圖靈的貓表示,不希望有人用EssayKiller來寫作業,因此並沒有開源相關****參數設置,colab的調用次數也有嚴格限制。
要是出現違規行為,可能整個開源項目都會被關閉,同時也沒法用Colab在線體驗了。
到底“消化”得怎麼樣?
@圖靈的貓介紹説,要想讓AI模型寫出這種效果的作文,在“語言生成模塊”的訓練集中,毛選和魯迅全集等著作佔比要超過10%。
而模型的其他訓練資料,則主要來源於開源中文散文數據集、高考作文數據集等。
那麼,訓練出的模型效果,是否符合預期呢?
不少網友表示,感覺AI還是“讀進去了一部分”的:
而對於作者@圖靈的貓來説,生成作文的質量也確實“比自己預期要好一些”。
但這並不表明,AI就已經能100%寫出像樣的高考作文了。
畢竟,最終呈現出來的幾篇高考作文,都是在語言生成模型後,經過機器判分+人工篩選,才展示在讀者面前的。
而在作文中所呈現出的排比等高級修辭手法,也只能説明訓練語料中包含這類修辭,而AI模型在學習的過程中“記憶”了它們,並不能説明已經學到了這些手法。
換而言之,這次的AI模型,效果確實超乎預期,但並不意味着它真正“消化”了這些語料。
那麼,這個AI模型接下來還會試些什麼?
@圖靈的貓表示,下一步的目標是“科幻小説”:
要是有空的話,我會將大劉、阿西莫夫和阿瑟克拉克等科幻作家的作品加入訓練集,讓AI模型試試寫科幻小説。
嗯,AI寫作開始有點賽博朋克那味了。
欣賞了毛選和魯迅文集的開源AI模型:https://github.com/EssayKillerBrain/EssayKiller_V2
Colab版在線生成器:https://colab.research.google.com/github/EssayKillerBrain/EssayKiller_V2/blob/master/colab_online.ipynb
參考視頻(已授權):https://www.bilibili.com/video/BV1aw411f7G9