你能判斷這個標題是機器人寫的嗎?——《華爾街日報》
Christopher Mims
你可能沒有注意到,但你在互聯網上閲讀的部分內容很可能出自機器人之手。而且這種情況很快就會變得更加普遍。
根據工具開發者、研究該軟件的學者以及投資內容自動生成公司的投資者所述,生成文本的人工智能軟件已經足夠複雜,其輸出常常難以與人類寫作區分開來。越來越多的公司正試圖利用這項技術,自動化生成我們可能依賴的信息。
“對於日常使用互聯網的大多數人來説,很可能已經接觸過AI生成的內容,”華盛頓州斯波坎市一家小型搜索引擎優化公司的負責人亞當·克羅尼斯特説。他補充道,他所在的專業搜索引擎優化團體中的每個人都在某種程度上使用這項技術。克羅尼斯特的客户包括數十家中小型企業,對於其中許多客户,他使用定製的人工智能軟件快速生成在谷歌搜索結果中排名靠前的文章——這種做法被稱為內容營銷——從而將這些網站的潛在客户吸引過來。
“我們的大多數客户不希望外界知道他們的內容是由AI撰寫的,”Glimpse.ai的首席執行官亞歷克斯·卡迪內爾説,該公司開發了克羅尼斯特使用的服務之一Article Forge。當被要求撰寫一篇關於小企業貸款的文章時,該公司的AI生成了一篇1500字的文章,開頭寫道:“在申請小企業貸款之前,研究你有資格獲得哪種類型的貸款很重要。”該公司有許多競爭對手,包括SEO.ai、TextCortex AI和Neuroflash。
谷歌公司發言人表示,谷歌清楚AI生成內容出現在搜索結果中的現象,並對此持開放態度,前提是AI生成的內容對閲讀者有所幫助。她補充道,語法檢查器和智能建議——谷歌自身工具中提供的技術——與AI內容生成一脈相承。
“我們的排名團隊關注的是內容的有用性,而不是內容的生產方式,”谷歌搜索公共聯絡員丹尼·沙利文説。“這使我們能夠創建解決方案,旨在減少搜索中所有類型的無用內容,無論是由人類還是通過自動化流程生成的。”
AI內容服務正在蓬勃發展。它們使內容創作者更高效,但也能夠生產出無人能分辨出是機器製作的內容。這通常也適用於其他類型的AI生成內容,包括圖像、視頻、音頻和合成客服代表。
由人工智能服務Dall-E生成的插圖,提示詞為“機器人在傳送帶上分類社交媒體應用”——這是對本專欄頂部人類創作插圖的描述。圖片説明:Dall-E 2022與其他類型的自動化一樣,讓AI處理對人類來説往往是苦差事的基礎寫作任務有許多潛在好處。話雖如此,廣泛且無法檢測的合成內容也存在相當大的危險。首先,它有可能取代一個龐大而繁榮的人類工作者生態系統,就像之前許多受自動化影響的行業一樣,由數量不斷減少的大型實體取代,從而擁有更大的力量來塑造人們的想法。在最壞的情況下,它可能給不良行為者提供一個強大的工具,在戰爭等危機時刻傳播欺騙。
人工智能生成內容的興起得益於一種被稱為計算創造力、人工創造力或生成式AI的現象。根據企業家Anne-Laure Le Cunff收集的數據,這一領域在兩三年前僅有少數幾家公司,如今已激增至超過180家初創企業。儘管科技投資整體環境低迷,這些公司近幾個月仍獲得了數億美元的投資。
使用相同機器人手部提示詞生成的第二幅Dall-E插圖。像"Madial"這類無意義詞彙頻繁出現在AI生成圖像中。圖片説明:Dall-E 2022荷蘭萊頓大學高級計算機科學研究所助理教授Peter van der Putten表示,我們網絡上遇到的許多內容已是自動生成的,而自動內容生成系統的應用才剛剛開始。“未來兩三年世界將大不相同,因為人們會大量使用這些系統,“他補充道。
到2025年或2030年,互聯網上90%的內容將是自動生成的,研究生成式AI及其陷阱的2020年書籍作者尼娜·希克表示。她補充説,並非我們看到的每10樣東西中有9樣是自動生成的,而是自動生成將極大增加可用內容的數量。其中一些可能以個性化的形式出現,比如包含合成視頻或根據個人口味定製的演員的營銷信息。此外,很多可能只是社交媒體上分享的自動生成內容,比如人們只需向內容生成服務輸入文本提示就能創建的文本或視頻片段。
以下是即將大量出現的合成媒體的幾個例子:藝術家、營銷人員和遊戲開發者已經在使用Dall-E、Midjourney和Stable Diffusion等服務,以不同藝術家的風格創作細節豐富的插圖,以及照片般逼真的幻想作品。Facebook母公司Meta Platforms的Meta AI部門的研究人員在9月公佈了一個可以從文本提示自動生成視頻的系統,而谷歌在10月推出了一個看起來更復雜的版本。
範德普頓博士和他的團隊開發了一個系統,能夠撰寫符合任何報紙風格的新聞文章。(《華爾街日報》擁有自己的AI文章寫作工具,該工具是與Narrativa合作開發的,這是一個“語言生成AI系統”,幫助人類作者生成部分市場更新。)
自動文本生成系統正在幫助小説家加速寫作過程,驅動客服聊天機器人,並支持一項名為Replika的服務,數十萬人將其視為他們的人工男友或女友——許多人表示他們已經愛上了它。
這種人工創造力的一個缺點是可能削弱信任。以在線評論為例,AI正在加劇欺騙行為。Fakespot的首席執行官薩烏德·哈利法表示,算法生成的虛假評論在亞馬遜和其他平台上呈上升趨勢,該公司開發了一款瀏覽器插件,用於標記此類偽造內容。他補充説,根據他們公司的檢測系統,雖然大多數欺詐性評論仍由人類撰寫,但約20%是由算法生成的,而且這一數字還在增長。
插圖:詹姆斯·斯坦伯格過去,亞馬遜曾表示,Fakespot無法判斷其網站上的哪些評論是真實的,因為它無法獲取公司的內部數據。該公司還表示,顧客在其網站上閲讀的評論中,超過99%是真實的。
值得注意的是,這些系統生成的許多內容存在錯誤或人類不會出現的怪癖。人工智能產生的一些內容仍需要人類進行審查,並在某種意義上進行編輯。
例如,範德普滕博士的報紙文章寫作AI可以自動以更具黨派色彩的媒體的語氣和政治傾向重寫一篇直白的新聞文章,但其輸出也可能包含事實性錯誤。(例如,在一篇文章中,它將荷蘭的首都標識為海牙。)
OpenAI軟件根據“宇航員騎馬”的請求生成了這張圖片。照片:OpenAI/法新社/蓋蒂圖片社AI生成的圖像中常常有奇怪的偽影。特別是Dall-E,它在渲染手或正確繪製人或動物的肢體數量方面表現不佳。從文本提示自動生成視頻的系統只能生成短視頻片段,就輸出質量而言,目前是所有這些系統中最原始的。
但在熟練的人類和複雜的人工智能的交匯處,結果可以與人類單獨創作的結果一樣好,甚至更好,而且可以更快地生產出來,使人類創作者更具生產力。例如,雖然克羅尼斯特先生的團隊使用AI文本生成服務為某些客户創建內容庫——比如回答常見的管道問題,旨在吸引人們訪問當地水管工的網站——但他的作者仍然會審查這些內容,並可能對其進行編輯,以進一步增強其對谷歌搜索算法的吸引力。“它不會取代作者,但可以補充他們的創作過程,”他補充道。
Hour One是一家通過創建照片級真實的人物虛擬版本,並使其能以原聲自動朗讀任何輸入文本,從而實現“克隆”真人的公司。目前效果仍略顯生硬。在YouTube紅人Dom Esposito使用該技術製作自己虛擬副本的視頻中,可以明顯區分哪些片段是自動生成,哪些是真實的Esposito本人。
但這項技術正在快速發展。最近,一個深度偽造版的演員基努·裏維斯席捲TikTok,在該應用上獲得超5.5億次觀看,並欺騙許多觀眾信以為真。其他名人如湯姆·克魯斯,也正被深度偽造技術處理。
Hour One戰略主管Natalie Monbiot表示,除了可信度差異外,其公司生成的虛擬演員與這些深度偽造內容的主要區別在於授權方式。Monbiot女士的公司會向同意授權虛擬形象用於商業用途的演員支付報酬,客户包括需要教學視頻虛擬主持的企業。而深度偽造目前處於法律灰色地帶,創作者與被模擬者之間通常不存在授權關係。
互聯網充斥着AI生成內容的風險多種多樣。首先,許多內容生成AI存在眾所周知的偏見。例如,一位AI研究員最近記錄顯示,在Stable Diffusion AI圖像生成器中輸入"雄心勃勃的CEO"一詞時,沒有生成任何女性高管的圖像。關於AI偏見的討論存在兩面性——一方面,缺乏問責機制時,AI可能像人類一樣做出帶有偏見的決定;另一方面,當由軟件生成內容或決策時,審計和系統性糾正這些偏見可能更容易實現。
更廣泛的風險在於,隨着頂尖創作者和公司生產力提升,他們能生成遠超人類個體管理能力的內容。根據人們對這類內容的喜愛程度及其低廉的創作成本,我們最終可能進入這樣一個世界:每天在互聯網消費的大部分內容由越來越少的人和公司創造。Coinbase開發者安德烈·里斯科夫在近期文章中描述了這個反烏托邦的極端版本:從搜索結果、短視頻到精心設計以求病毒式傳播的社交媒體帖子,互聯網的某些部分最終可能幾乎完全由人工智能生成。
希克女士表示,即使人工智能生成的內容不會完全佔領整個互聯網,但隨着其日益普及,我們所有人都可能比現在更不信任所看到的一切,這種風險確實存在。可以説,這種情況已經發生——人工智能通過算法推送符合我們偏見、加劇立場分化的內容。但隨着算法生成的內容比以往任何時候都多,且可能專門針對我們的世界觀和傾向量身定製,這種情況可能會變得更糟。
“這就是’騙子紅利’,“希克女士説。“如果任何東西都可以偽造,那我為什麼要相信任何東西是真實的?”
欲獲取更多《華爾街日報》技術分析、評論、建議和頭條新聞,請訂閲我們的每週通訊。
聯繫克里斯托弗·米姆斯,郵箱:[email protected]