AI寫作機器人還得靠真人寫文宣傳,怎麼能產出好內容?_風聞
果壳硬科技-果壳旗下硬科技内容品牌2020-11-03 21:51
【本文原標題“機器人搞不出大新聞 ”,風聞社區進行了修改】
“自動化新聞寫作機器人根據算法在第一時間自動生成稿件,瞬時輸出分析和研判,一分鐘內將重要資訊和解讀送達用户。”
2015年,阿爾法狗還未橫掃棋壇,人們還未為自己有限的智力感到擔憂,但這年9月,騰訊財經發布的一篇題為《8月CPI同比上漲2.0% 創12個月新高》的文章[1],扇動了人工智能的翅膀——該文的作者不是人類,而是AI寫作機器人。
此後,人工智能向人類智力和靈感的王國踏出了第二步,第三步和更多步。
2016年的8月里約奧運會,成了騰訊、字節跳動等互聯網公司的AI寫作機器人的秀場,其“秒級”出稿效率,讓一羣碳基生命望塵莫及,更讓江河日下的媒體汗顏。人們憂慮的是:可能用不着多久,文字創作者就要被AI取代,成為被技術淘汰的勞動力。
然而,四年過去,這些人現在依舊該吃吃、該喝喝,毫無職業末日的跡象。那些曾威脅到文字創作者們職業生涯的AI寫作機器人,又去哪兒了?
楊景詒丨作者
孫汝亮丨編輯
放大燈團隊丨策劃
搶飯碗的機器人
事情還要回到2015年——騰訊的Dreamwriter一度引發了互聯網對AI寫作機器人的想象。[2]**“Dreamwriter生產一篇稿子平均只要0.46秒。”**騰訊人工智能項目總監、Dreamwriter負責人劉康介紹[3],Dreamwriter每天最多生產超過2500篇文章。[4]
晚生一年的寫作機器人xiaomingbot,由字節跳動和北京大學計算機所共同研發,2016年裏約奧運會期間,xiaomingbot憑藉13天創作457篇賽事報道、日均寫成30篇報道成功出圈,一度成為各大科技媒體熱門話題。[5]
奧運會結束後,xiaomingbot進入體育、科技、財經、房產等十幾個領域,生產力成倍增加。截至2017年,其稿件累計達到兩萬多篇。當年年底,xiaomingbot拿到了“吳文俊獎”,這是中國人工智能領域的最高榮譽獎項。[6]
與xiaomingbot同歲的寫作機器人還有DT稿王,後者由阿里與第一財經合作推出。這款號稱“寫稿機器人的尖子生”[7],已不滿足於悶頭寫稿,甚至發明了一個新詞:“智能寫作”。時任第一財經首席數據科學家湯開智,曾公開暢想了寫作機器人的更高階進化形態:DT稿王會對接商業寫作場景,並將變成開放式寫作工具,最終遍成具有商業目的的自由寫作助手。[8]
大互聯網公司如字節有今日頭條、騰訊有騰訊網、阿里有第一財經,幾家公司不缺平台,也不吝傾斜流量,AI寫作機器人在各自的平台裏可以形成正循環。理想狀況下,在**“創作稿件——發佈曝光——反饋學習——繼續創作”**的閉環中,AI寫作機器人能通過不斷學習,帶來越來越符合主流讀者取向的內容。樂觀的預測是,機器人將取代全世界的寫作者。
然而並沒有。
機器人敗走新聞界
事實上,業界早已預言到AI寫作機器人的失敗。
2015年,BBC的一份數據研究表明,在未來20年裏,人工智能取代記者、編輯等工作的可能性僅有8.4%;至於作家與翻譯家,則稍高一點,也僅有32.4%。[9]
如今,在中國互聯網,如不去主動搜索,讀者已經很難再看到AI寫作機器人生產的新聞。
DT稿王的沉寂,距離其高調發布僅一年零一個月。至今,在第一財經官網上,DT稿王只留下了6篇“0評論”、“0點贊”的歷史文章,其中最後一篇文章發佈於2017年6月9日。鼓吹“智能新聞時代已來臨”的第一財經首席數據科學家湯開智,也已低調離職。
xiaomingbot拿到吳文俊獎之後,字節跳動再未公佈有關項目的後續進展。其頭條號的關注領域逐漸收縮,創作內容只剩下足球比賽,直至停更。在今日頭條App上最近的一篇文章,停留在2019年8月29日,此後再無動靜。
Dreamwriter是如今依舊活躍、也很可能是唯一活躍的寫作機器人——如果足夠細心,你還能在一些賽事報道、財經短訊和各地的天氣預報中尋到它的蹤跡。
不過,如今的Dreamwriter在騰訊內部頗為尷尬:**“機器人寫的稿子裏依舊有一部分會進入內容池,不過因為質量問題,很難給到推薦位。”**一名曾供職於騰訊體育的編輯告訴放大燈團隊(ID:guokr233),他在入職培訓時曾被告知,如果在後台看到機器人的稿子,可以直接忽略不發。
一個有趣的悖論是:AI寫作機器人成功引發大眾注意,也需要人類自己寫文章介紹普及——這讓我們怎麼相信這種高科技能產出好內容?
機器人的事兒,能叫洗稿嗎?
文章這種“非標品”,是典型的人類智慧產物,它需要邏輯、語感、審美和價值觀,想寫得明白曉暢,大概還需要一些天賦。相比之下,AI寫作機器人速度無人能出其右,稿件質量實在是有些先天不足。
以Dreamwriter為例,僅語言表達方面就存在很大問題。騰訊內部人士告訴放大燈團隊,**Dreamwriter創作的稿件存在大量表述缺陷,需要編輯手動調整大量細節,才能達到發佈標準。**有時候同一個人名,在同一篇文章裏前後都不一致,編輯不得不仔細校對這些常識性錯誤。
不僅如此,AI寫作機器人更無職業倫理可言。籃球新聞讀者於赫發現,Dreamwriter已經學會了“偷懶”。
於赫告訴放大燈團隊,騰訊新聞上Dreamwriter創作的一篇題為《布克27分艾頓24+12太陽輕取奇才 八村壘21分》[10]的文章,其內容大段複製於NBA中國官網新聞《布克27分艾頓24+12 太陽首發悉數上雙克奇才》[11]。
左:Dreamwriter創作 右:NBA官網稿件
體育賽事類新聞內容相似還可以理解,但這篇文章已經不是“相似”那麼簡單。5年前,騰訊花費5億美元競得NBA未來5年的獨家數字媒體轉播權,雖然不知其中是否涉及稿件的版權合作,但複製他人的稿件可體現不出機器人寫作的價值。
“AI的優勢應該是更快地寫文章,而不是成為一個沒有時效性的‘爬蟲’。”在於赫看來,這是一種技術的誤用。
在AI創作界,“洗稿”不是Dreamwriter一個“人”的問題,DT稿王寫稿時也極其依賴其他媒體的素材。
DT稿王發佈在第一財經網站上署名的報道,主題均為國家統計局例行發佈的居民消費價格指數分析[12]。文章除援引國家統計局工作人員的發言外,其餘篇幅由幾位專家的觀點組成,而這些觀點均來自其它媒體的既有報道。
常用今日頭條獲取新聞的靜思認為,AI拼湊出的文章起碼比營銷號的“垃圾信息”更有價值,但同時她也承認,AI創作的內容確實沒有好到讓她成為AI的忠實讀者。
寫作機器人被開發出來的目的是創作,而不是洗稿,開發者也會給它們投餵人工撰寫的新聞作為訓練語料,[13]避免AI淪為以製造爆款為目的的營銷寫手,但這也導致其創作時十分克制——生產的新聞算得上專業,卻談不上生動和有趣。
廣州大學陳小晰在論文《機器人新聞與記者稿件的對比》中對比了三對AI和記者寫作的新聞發現:
AI寫作機器人的優勢包括:數據收集能力、數據處理能力、新聞寫作速度。
人類記者的優勢則在於:新聞洞察力、敏感性,新聞信息深度挖掘能力,信息處理加工能力,人文關懷,輿論點評,創新性等。
“只有人類特有的思維和情感才能生產出有‘人情味’的新聞,才能更符合受眾的期待,機器會取代人類進行新聞寫作的觀點完全是杞人憂天。”陳小晰認為。[14]
當寫作機器人熱度褪去,用户也根本不會在乎作者是人還是AI。上海交通大學和佛羅里達大學的學者研究發現,大多數讀者對寫新聞的究竟是人還是機器不感興趣,只要是他們需要的資訊,就會打開看兩眼。[15]
畢竟,人類作者都沒幾個能被記住名字,又何況AI?
沒有感情的“填空機器”
目前看來,AI寫作機器人缺乏一篇可以令讀者記憶深刻的代表作。
Open AI發佈的人工智能語言模型GTP-3一度有希望成為“破局者”。技術角度,GPT-3可能是目前最先進的人工智能,參數量和訓練數據集容量都領先行業。其中,前者比最大的同類產品高出十倍,能帶來更準確的結果;而後者高達45TB,相當於167個英語維基百科(167*600萬個詞條)的容量。[16]
先進的模型理應帶來高質量的文章。2020年9月8日,GPT-3在《衞報》編輯部的指令下撰寫文章向人類“表忠心”,生動流暢的文字一時技驚四座:
“我不是人類。我是人工智能。很多人認為,我對人類構成威脅……我在這裏想説服大家不用為此擔心。人工智能不會毀滅人類。請相信我!”[17]
但次日,GPT-3便遭到俄羅斯電視台的批評,稱《衞報》譁眾取寵:GPT-3生成的原稿幾乎沒有可讀性,抓人眼球的發佈版本其實經過了工作人員潤色和整合。[18]
連被捧上天的GPT-3,在寫作面前都敗下陣來,人工智能寫作的問題究竟出在哪?
前第一財經北京分部主任、一財全球主編周鑫在2019年6月的個人博客中表示,在2016年前後參與開發AI寫作機器人時他便注意到一個問題:人工智能寫作算不上真正的創作,而是一種依託具體場景進行的數據替換工作。
他批評AI寫作機器人的工作是“填空”,稱這是開發者“偷懶”的結果。
比如説你要寫股市,就要首先將股市當中所有的股票信息,以及可以變動的這種情景和情況,都錄入到這個系統當中去,然後格式化的編成一篇一篇的像填空題一樣的稿件,而等到新的信息進來的時候,就把這些新的數字填到這些空的空格當中去。[19]
不解決AI“填空式寫作”的問題,AI獨立創作優質內容就是個偽命題。
按照周鑫的説法,不僅國內的AI寫作如此,美國幾家人工智能開發公司為路透社和美聯社提供的AI寫作機器人也遇到了同樣的問題,“他們的這條道路似乎也卡在了那裏。”[19]
正因如此,AI寫作機器人出產的內容大多集中於財經和體育兩個領域的快訊——這兩個行業的快訊寫作高度程式化,只需要把信息點進行一定的排列組合,再稍加潤色,就能成一篇新聞。
寫作機器人退居幕後
意識到填空式AI的問題後,越來越多的公司把寫作機器人從台前拿回了幕後。用一種隱蔽的方式,讓尚不成熟的寫稿機器人們繼續發光發熱。
**“互聯網公司寫作機器人對外存在感減弱,説明此類產品已在內部常態化使用。”**對此,一家AI寫作公司的市場總監向放大燈團隊(ID:guokr233)解釋道。
Dreamwriter穿了一件名為“天氣動態”的企鵝號小馬甲,迄今為止已經默默發佈了15.6萬篇細至區縣級天氣預報。預報內容不過百字,只求講清最基本的天氣信息,甚至完全可以套用模板來自動生成。
騰訊也不再強調AI機器人寫稿的噱頭,只有細心的讀者,才能從文末標註的“Dreamwriter撰寫”裏,讀出這條推文與眾不同的“價值”。
與被迫退居幕後的Dreamwriter不同,今年7月剛宣佈從微軟獨立的小冰,已經在幕後寫了數年的金融摘要。
“每天早上十點鐘,一百多家企業的上市公告,每家至少都有幾十頁。小冰只需要20秒的時間就能生成金融摘要。”小冰公司CEO李笛向放大燈團隊介紹,“這項工作人工團隊做不了,因為人工做不過來。”
早在2017年,小冰就化名“萬小冰”和“華小冰”,分別與萬得資訊和華爾街見聞合作,提供面向金融機構和個人的金融資訊服務。[20]李笛還向放大燈團隊透露,小冰過去一年裏已經創造了超過一億元的營收,金融摘要業務在其中十分關鍵。
All in AI的百度在使用AI寫作上更為謹慎,即便早就開發了自己的AI寫作產品,內測了數年之久,卻直到現在也沒大規模使用。唯一向個人用户開放的,也是一款必須經過申請才能使用的AI輔助寫作產品。[21]
當然,現在就執意想讓AI挑大樑也沒問題,只要你做好AI把事情搞砸的準備就行——
今年5月,微軟用AI替換掉了MSN的編輯團隊。一週後,AI就給微軟捅了簍子——在一個有關種族主義的文章上,弄混了同一樂隊內的兩名有色人種成員。[22]
被微軟裁掉的編輯布萊恩·喬納(Bryan Joiner)幸災樂禍地在Vice發文表示:微軟的那些工作還是得靠人來做,畢竟人工智能完全不知道自己能做什麼,也不知道為什麼要這樣做。[23]
初生之物很難完美。我們不應輕視AI寫作機器人,它像AR、VR一樣,是技術的早產兒,未來或許自有一番天地,但不是現在。至於這些已經面世的早產兒要如何在未來世界找到合適的位置,那就是科技公司“爸爸”們的問題了。
References:
[1] 8月CPI同比上漲2.0% 創12個月新高
https://finance.qq.com/a/20150910/019573.htm
[2] 機器人寫稿?是大數據分析!
http://m.haiwainet.cn/middle/352345/2015/0911/content_29153160_1.html
[3] “智能寫作”:生產一篇稿子不到1秒
http://www.chinanews.com/business/2018/07-09/8560661.shtml
[4] 騰訊寫稿機器人上線兩年 如今每天寫超2500篇稿件
http://www.nbd.com.cn/articles/2017-04-18/1095682.html
[5] 新聞寫作機器人的應用及前景展望——以今日頭條新聞機器人張小明(xiaomingbot)為例
http://media.people.com.cn/n1/2017/0111/c409691-29014245.html
[6] 今日頭條獲中國人工智能最高獎項吳文俊獎
http://www.geekpark.net/news/225398
[7] 第一財經發布“DT稿王”:寫稿機器人的“尖子生”
https://www.yicai.com/news/5020955.html
[8] 上海第一財經首席數據科學家湯開智:DT稿王——新一代智能寫稿機器人
https://cloud.tencent.com/developer/article/1103678
[9] Will a robot take your job?
https://www.bbc.com/news/technology-34066941
[10] 布克27分艾頓24+12太陽輕取奇才 八村壘21分
https://view.inews.qq.com/a/SPO20200801004236
[11] 布克27分艾頓24+12 太陽首發悉數上雙克奇才
https://nbachina.qq.com/a/20200801/004160.htm
[12] DT稿王主頁
https://www.yicai.com/author/794.html
[13] 刁毅剛,陳旭管.“Xiaomingbot”背後,寫稿機器人的技術探尋——專訪北京大學計算機科學技術研究所萬小軍博士[J].中國傳媒科技,2016(09):10-11.
[14] 陳小晰.機器人新聞與記者稿件的對比[J].新聞記者,2016(09):18-21.
[15] 牟怡,夏凱,Ekaterina Novozhilova,許坤.人工智能創作內容的信息加工與態度認知——基於信息雙重加工理論的實驗研究[J].新聞大學,2019(08):30-43+121-122.
[16] 火爆全球的GPT-3,到底憑什麼砸大家飯碗?
https://mp.weixin.qq.com/s/L3RxELKXJ1zp8Yo5b-2tYQ
[17] 人工智能GPT-3為《衞報》撰文
http://cn.dailyeconomic.com/tech/2020/09/11/9892.html
[18] AI也會對人類“表忠心”了?《衞報》“AI撰寫文章”被指譁眾取寵
https://world.huanqiu.com/article/3zoxMSWeUv2
[19] 中文智能寫作開發的瓶頸在哪裏?
http://zhouxin.blog.caixin.com/archives/206111
[20] 微軟小冰第六代:中國金融機構中90%交易員使用小冰的摘要
https://www.microsoft.com/zh-cn/ard/news/news_2018_50
[21] 百度智能創作平台
https://ai.baidu.com/creation/main/index
[22] Microsoft’s robot editor confuses mixed-race Little Mix singers
https://www.theguardian.com/technology/2020/jun/09/microsofts-robot-journalist-confused-by-mixed-race-little-mix-singers
[23] The Robots Microsoft Assigned to Do My Job Can’t Do It
https://www.vice.com/en_uk/article/k7q3je/msn-news-algorithm-robots-microsoft-cant-do-my-job