能縮書會寫作,還可以評選人類作品:AI能為文字與文學帶來什麼?_風聞
观察者网用户_268317-2019-02-28 10:17
通過機器進行的模式化指導會損害文學本身嗎?對此做純文學出身、並認為自己有一顆純文學之心的走走表示,目前AI寫作程序主要面對的是靠故事情節取勝的網絡文學而非純文學。走走也認為,在不久的將來,AI寫作程序極有可能取代網絡寫手,自己生成符合觀眾胃口的網絡文學作品。
來源:界面新聞

《思南文學選刊》2019年1月號刊登了一份特別的文學“AI榜”。在這份AI最喜愛的作品榜單中,科幻作家陳楸帆去年發表於《小説界》雜誌6月刊上的短篇小説《出神狀態》以0.998941845的係數位列第一,以0.000001的優勢險勝莫言發表於《十月》雜誌2018年1月刊的《等待摩西》。
這是《思南文學選刊》與一個名叫“谷臻小簡”的AI軟件合作完成的榜單,也是目前中國文學領域發佈的首份AI榜單。AI軟件在“閲讀”了2018年中20本文學雜誌刊發的全部771部短篇小説後,挑選出了它最喜歡閲讀的一批作品。據軟件開發者、前《收穫》雜誌編輯走走介紹,AI算法看重的是小説的優美度,即情節與情節之間的節奏變化的規律性,以及結構的流暢程度。同時,由於目前的AI程序引進了概率算法,因此它是根據雜誌的最大風格來做出判斷的,也就是説,AI會在最專業的雜誌中選擇出一批最專業的作品,當然這也就意味着,它也會在最通俗的雜誌中選出最通俗的作品。
截至2019年1月20日,“谷臻小簡”的最愛讀物始終是莫言的《等待摩西》。然而,21日下午3點左右,參與此次評選的《小説界》和《鴨綠江》雜誌的作品趕到,新增80部短篇小説。下午7點20分,情況發生了改變。AI最終選定的年度短篇是陳楸帆的《出神狀態》,《等待摩西》被擠到了第二位,位列榜單第三的是作家雍措發表於《青年文學》雜誌的小説《午後陽光》。
在這份收入了60位中國作家及其小説的榜單上,既有我們熟悉的身影,比如獲得過諾貝爾文學獎的作家莫言、前段時間在“匿名作家計劃”中進入終選的青年作家葉揚(獨眼)、短篇小説《刺殺小説家》正被改編為同名電影的熱門作家雙雪濤、科幻作家寶樹,以及在文學圈內時常被認為小説十分“符合《收穫》調性”的張楚。當然,榜單也涵蓋了一批並沒有怎麼進入大眾讀者視野的作家。看到這份榜單呈現的結果,走走也在考慮接下來應該如何完善算法——一方面,她希望AI能夠挑選出質量上乘的作品;另一方面,她認為不能完全用《收穫》的風格去要求AI。
《思南文學選刊》主編黃德海對於這份榜單呈現的中立結果很感興趣。他在接受界面文化(ID:Booksandfun)採訪時表示,當初決定收錄這份特別的榜單,一方面是因為AI發展迅猛,想看看AI在文學方面能夠創造出何種可能性;另一方面則是因為每到年末歲尾,文學圈就湧現出一堆文學排行榜——不管評選結果如何,總有人質疑評委的專業度,又或者認為評選結果依賴的是人情——“那麼,一個相對中立的選擇標準,會是比較好玩的吧?”

《思南文學選刊》
有趣的是,作為AI最終選定的年度短篇作品,陳楸帆的《出神狀態》裏恰好也用到了由AI軟件生成的內容。AI從眾多作品中識別出了另一個AI,“這簡直是生成整個榜單過程中最華彩的部分,”走走在接受界面文化採訪時説到。出於好奇,她在榜單結果出來後馬上打開了陳楸帆這篇小説,留意到結尾有這樣一段註釋:“帶*號楷體字部分為AI程序通過深度學習作者風格創作而成,未經人工修改。”
她立即聯繫了陳楸帆,詢問這個註釋究竟是一種噱頭,還是真的包含AI寫作內容。他當即把自己使用的AI軟件發給了走走,這個軟件是他的朋友、創新工場CTO兼人工智能工程院副院長王詠剛製作的,訓練數據包括陳楸帆既往的十幾部小説作品,以及作為參考語料的赫胥黎、阿瑟·克拉克、威廉·吉布森、尼爾·斯蒂芬森等人的科幻小説作品。第一次看到AI程序寫出來的句子時,他覺得既像又不像自己寫的,有先鋒派的味道。製作者王詠剛特別喜歡機器寫出的“重重追逐着人類發現的觸覺,以及即將看清左右的囚籠”這一句,因為看上去“像是得了上世紀八十年代朦朧詩派的真傳”。除了參與AI評選的《出神狀態》一文,在日前出版的新書《人生算法》裏,這個AI程序也與陳楸帆進行了互動。
“一個AI,何以從771部小説中,準確指認出另一個AI的身影?”走走在隨榜單一同發佈的《未知的未知——AI榜説明》一文中發問。陳楸帆則感慨説,“這簡直比科幻還科幻。”AI程序已逐漸習得了陳楸帆的寫作偏好——在使用祈使句時愛用什麼句式、描寫人物動作時喜歡用什麼樣的形容詞或者副詞等等。在掌握了關於語句的統計規律後,在寫作環節,AI程序便會從大量的語料中隨機找到一些詞,並把這些詞彙按照寫作規律拼接在一起,形成句子。當陳楸帆被問到是否擔心AI程序有一天會寫出比自己更好的作品,他幽默道:“這倒不會,要是真寫出來我就躺賺了。”王詠剛也在近期上海的一場講座中提到,目前AI寫作程序仍然只是一種“初級的機器輔助寫作”,即通過給定關鍵詞和關鍵元素在數據庫中進行檢索,找到歷史上所有涉及這個詞語的文本。這也導致目前AI寫作有篇幅限制,而且在涉及句與句、段與段之間的關係時,AI便有點捉襟見肘了。“AI現在還是個baby,”走走對界面文化説。

《人生算法》陳楸帆 著中信出版社 2019年1月
除了為影視改編服務之外,走走發現,這個小説軟件也可以指導一部分學生進行寫作。目前她的團隊正在嘗試和上海視覺藝術學院合作,這是中國第一所開設網絡文學創意寫作本科教育的大學。學生創作的網絡小説被輸入軟件後,AI會按照理想的故事模型和情節曲線對故事進行檢測。“比方説一個W陣型,如果W的第一個彎度不夠,那就是這個人的命運不夠悲慘,那麼它上升的曲線就不夠大,故事就不夠精彩。我們也有劇本算法,目前我們針對的是電影,不是電視劇。針對電影來講,就是可以判斷哪一幕寫的比較平、哪一幕寫的比較精彩,這些都是可以調整的。”
走走2017年底從《收穫》雜誌辭職,開始涉足影視版權轉化工作。她隨後發現,即便是如餘華、須一瓜這種在文學圈頗有名氣的作家,在影視市場上的認知度可能還比不過網絡文學。這激發了她對網絡文學的興趣。在瀏覽各大平台網絡文學的過程中,她驚歎於網絡文學動輒三百萬字、五百萬字的體量,於是想到了一個“偷懶”的辦法:開發一個能夠迅速讀取小説並且提取簡介、人物和情節的軟件,並將這樣的分析報告提供給影視開發方供其參考,以便進行迅速判斷,這便是“谷臻小簡”AI軟件的由來。
另一方面,她也很清楚AI的侷限。“我們現在沒有辦法教人工智能識別語言的好壞,即便是人,我們也很難教會他們識別語言的好壞,我們無法評判是王朔的語言好,還是餘華的語言好。AI能夠識別的是節奏感、敍述的強弱、淚點笑點的分佈以及整個結構是不是工整。事實上,意識流小説、多視角、平行空間等等各種文本的技巧並不適合影視改編。影視改編基本上還是線性結構為主,頂多就是一個倒敍。因此影視改編的路線是很清晰的,所以這個AI也比較笨,是圍繞這個方向來選小説的。”
在去年的西湖IP大會上,由谷臻故事工廠聯合浙數文化東方星空數娛發佈的《賣座故事曲線報告》中,AI研究和分析了過去20年間724部改編成影視的文本,通過分析小説的主題、情節、人物以及有關小説風格和設置的各種變量,探討了影視作品暢銷的內在元素。除了根據文本中出現的人物和場景來識別主角、主角之間的強弱關聯以及主要場景,另一個對AI來説非常重要的判定因素是情節曲線。據走走介紹,情節曲線的計算是根據文本中的動詞進行統計的。“情節是衝突造成的,衝突是通過動詞呈現的。在影視作品裏,衝突是要通過演員的動作來呈現的,所以主要的東西一定是動詞和動作的權重。因此情節曲線主要是根據動作權重來計算的。”

谷臻故事工廠分析得出的人物互動關係圖
AI統計得出結論,能被改編的文學作品有強情節、幾個引人注目的人物和一箇中心主題。通過分析724部作品,AI得到了六種類型的故事曲線(W型、M型、N型、倒N型、V型和倒V型),其中W型比例最高。這種類型往往首先是一個正能量故事,故事初期主角略被動,但結局一定是樂觀的,情節起伏均勻對稱,節奏感強——《琅琊榜》和《香蜜沉沉燼如霜》都屬於這一類型。
這種通過機器評定和操作的模式化指導,是否會損害文學本身?對此,做純文學出身、並認為自己有一顆純文學之心的走走説,目前AI寫作程序主要面對的是靠故事情節取勝的網絡文學,而非純文學。她認為,在不久的將來,AI寫作程序極有可能取代網絡寫手,自己生成符合觀眾胃口的網絡文學作品。
除了應用於影視改編外,走走希望未來可以利用這個AI軟件搭建一個薦讀平台。目前軟件的讀取速度已經達到了平均四秒鐘一本書,“我希望為中國所有的圖書都做一個導讀版,相當於建立一個百科全書式的圖書館導讀系統,從而進行通識教育。”讀者在看過導讀版之後,可以自行判斷一本書是否有乾貨,是否要購買這本書進行深度閲讀。
當被問及這項服務和如今盛行的《羅輯思維》這類抽取乾貨的讀書產品有何不同時,她認為,人工拆書存在一定的主觀性,受個體視野和知識格局影響較大。並且,目前的人工拆書產業鏈條建立在對於廉價勞動力的壓榨之上——通常是經過大學生之手進行拆解,然後流轉到行業大V手中。“這種行為不尊重圖書,也不尊重作者。如果是作者自己去講解,我是認可的。但這種拆書行為僅僅是為了提高效率,是為了掙錢。”走走在解釋二者的區別時説,“我們不是要代替這本書,而是提供一個進階的選擇——可以通過導讀版給讀者一個瀏覽經驗,然後他們決定要把哪本書帶走、要不要繼續去了解一本書。”