一鍵量產垃圾,人類:我謝謝你_風聞
酷玩实验室-酷玩实验室官方账号-1小时前
在2023年的《完蛋!我被美女包圍了!》爆火之前,你就有機會喊出同樣的句式。

只要在2021年用谷歌搜索中文內容,肯定會發出這句感嘆,“完蛋!我被百科知識網包圍了!”
滿屏都是“XX知識網”“XX百科網”的鏈接,域名全是臉滾鍵盤打出來的亂碼,內容全是程序生成的廢話。

互聯網界的喪屍圍城,也不過如此。
這種裝滿垃圾信息的網站,就是內容農場的一種。
什麼是內容農場呢?顧名思義,這種網站大量“養殖”內容,內容質量是高是低,不重要,只要把人騙進網站裏,站長就能賺到廣告費,成功噶韭菜。

頁面明顯分成三部分,第一部分第一句話是有用信息,其他全是廢話和廣告
如果按照這種定義,很多互聯網大廠的“某某號”平台,也能看作是內容農場。但我們一般不這樣定義,因為大廠平台轉載內容,一般都獲得了原作者的正規授權,而垃圾內容農場屬於私自盜竊別人的工作成果。
一般的小農場,圈一波錢之後立刻跑路,像是前邊説的“XX知識網”,現在都上不去了。
但在中文內容農場裏有個“日不落”傳奇,這家名叫“每日頭條kknews”的內容農場,每個月有6000多萬訪問量,靠着吃Google AdSense的廣告收入,站長月入100萬,美元。

這就是互聯網垃圾信息的最終形態嗎?當然不是。
前幾天央視曝光了一家國內的MCN機構,靠着AI技術採集熱點信息,批量生產虛假新聞,圖文並茂,每天能生產幾千條。

這種模式像極了內容農場,但它的本質是營銷號。
互聯網垃圾信息的生產模式,就是從內容農場升級到營銷號,再升級到AI胡言亂語的過程。
01
內容農場,上古互聯網遺毒
國外早期的內容農場裏不一定有機器人,但一定有活人。
像是Demand Media這家公司,2009年左右玩得風生水起。

Demand Media收購了很多網站,教人做事的 eHow.com 就是其中之一
公司老闆發現,做生意的人很笨,明明產品和服務質量很高,但不會打廣告。於是Demand Media瞄準了“廣告如何觸達用户”這個藍海市場。
比如有人想買二手車,在當時的谷歌裏搜索相關問題,大概率找不到賣二手車的商家。Demand Media僱傭一堆寫手,批量生產“二手車在哪買”的同類文章。
這坨文章裏並未提供去哪買車的實用建議,而是反覆重複“買賣、二手車”等關鍵詞,並且貼上一堆跟二手車無關的廣告鏈接。

人類的特點是復讀機,互聯網的特點也是。關鍵詞重複多了,就能提高在搜索引擎裏的排名。
靠着這堆互聯網垃圾,Demand Media在2011年公開募股,估值15億美元。但是不到3個月,網站的流量暴跌40%,因為谷歌更新了算法。算法更着更着,就把Demand Media更沒了。
靠着玩弄算法暴富,遲早會被算法反噬。
後來的內容農場都學聰明瞭,它們不搞大陣仗,悶聲噶韭菜。而且不生產內容,只是內容的搬運工。
最常用的方法是直接爬取別人的文章成品,講究一點的,要給文章掐頭去尾、隨意魔改,顯得像是原創。
拼湊信息這條路就比較隨性了,用爬蟲從各種網站上搜刮隻言片語,配上經典的“小編體”,車軲轆話能把你繞出二里地。

小編體生成器
更高級的路線是機翻外網,它們最愛翻Stack Overflow、GitHub這類網站,所以我們搜索科技、編程類的信息時,能經常會被機翻信息荼毒。
甚至簡單機翻不能滿足它們的需求,必須英譯中譯英譯中,多倒騰幾遍,讓讀者難以反查內容來源。
是個正常人都能看出來,內容農場100%是垃圾網站,為什麼還能排在搜索引擎的第一頁?
因為它們精通SEO技術,也就是search engine optimization,搜索引擎優化。簡單來説就是,搜索引擎愛看什麼,內容農場就做什麼。

有人專門賣SEO課程
最弱智的“小編體”,本意不是給人看的,而是給搜索算法看的。每重複一次廢話,就能在搜索權重裏提高一點。量變產生質變,説的就是這個道理。
但是“每日頭條”“壹讀”這種服務器在國外的大型內容農場,走出了不同的路。
微信公眾號這類中文信息孤島裏有非常多高質量內容,但它們不對搜索引擎開放。所以大型內容農場瞄準這塊空白,專門從公眾號裏扒內容。
被原作者發現怎麼辦?這些網站屏蔽大陸IP,沒點技術手段,原作者根本不知道自己的創作被盜用了。

所以在搜索引擎眼裏,你這個內容農場簡直太優秀了,全是高質量獨家內容,每天更新幾十上百篇文章,這得僱多少牛馬每天寫稿啊!絕對是小微企業無法觸及的高度!良心原創網站必須推到前排!

我們的文章,也被某些內容農場禍害了
現在使用搜索引擎的人越來越少,很多人把微信、抖音等平台當作搜索引擎來用,這些地方同樣充滿了垃圾信息,而且是2.0版本。
02
營銷號,互聯網的“注水肉”
我們經常能看到各種“清朗行動”,每次出手都能精準封禁無良賬號。這類無良帳號,大多屬於營銷號範疇。
營銷號是互聯網垃圾信息的2.0升級版,當內容農場還在無腦搬運時,營銷號已經精通“原創”垃圾信息的高科技了。
像是“開局一把刀,裝備全靠撿”這種廉價頁遊廣告,玩的就是一個“掛羊頭賣狗肉”,這個套路就是營銷號的制勝王牌。

“掛羊頭”指的是特別唬人的標題和封面,早期經典套路是“震驚體”。其實很多媒體都喜歡用震驚體,畢竟人類的種族天賦是看熱鬧不嫌事大,誰不愛看大新聞呢?
但是2017年,有網友發現UC的文章標題高頻使用“震驚!”這個開頭,於是調侃他們是起了個“UC震驚部”,這才讓震驚體成為流行套路。

後來的標題套路逐漸“謎語人”,比如“速看,再不看就晚了”,怎麼的?我不看這篇文章,作者就要吹燈拔蠟嗎?
在情緒價值當道的今天,標題套路也要輸出強烈的情緒,像是“XX大廠,哭暈在廁所”“XX道歉了,但我不買賬”,最好在封面圖上給照片的眼部打碼,更添一絲窺腥的爽感。

“賣狗肉”很好理解,正文內容簡單直白兼具話題性,甚至無腦反智、造謠抹黑,復刻黃色新聞時代的“榮光”。
想識別營銷號,其實很容易,從帳號名稱、第一印象就能判斷。必須説明,就算符合這些特徵,也不一定100%是營銷號,如有誤傷,純屬活該。
首先從賬號名稱判斷,“某人+某垂類”的組合是營銷號的常用套路,什麼“XX看球”“養生界XX”“XX八卦哥/姐”……。

完蛋,我又被包圍了
如果是圖文內容,只要看內容是不是空洞的車軲轆話就行。
視頻更容易鑑定,開篇一句AI配音的“哈嘍大家好,我是XXX,最近發生了一件很火的事情,我們一起來看看吧……”
然後用幾秒鐘展示一段已經嚴重包漿的144p豎屏短視頻,結尾跟一段話術“這期視頻到這裏就結束了,小夥伴們有什麼看法呢?在評論區留言,點個關注再走呀”。

好傢伙,整個視頻一共30秒,開頭結尾的廢話佔了25秒。
如果BGM用的是久石讓的《Summer》,聽我的,朋友,快逃。

這羣營銷號批量製造信息垃圾,動力在哪裏?因為真賺錢。
輸出情緒價值的營銷號,內容不需要列舉證據、分析事實,只要捏着熱點事件輸出暴躁的情緒,廣告費、打賞就來了。
賣賬號也是不容小覷的賺錢方法,粉絲數量超過1000就有人買。短視頻平台的千粉帳號能買到120元,萬粉帳號300元。
配合一些自動抓取內容的工具,批量起號並不難,困難的是如何註冊大量帳號。我們都知道,註冊帳號需要實名認證。所以搞營銷號的人,必須在非法渠道買賣身份信息。
這種需求催生出一條灰色產業鏈,很多不懂互聯網、缺乏隱私保護意識的老年人,就被騙子偷走身份,成了營銷號鏈條裏的受害者。
只要花點成本搭建起自動化工作流,營銷號就能躺着賺錢。
自動化營銷號有多可怕?2019年有報道説,營銷號“show娛娛”被曝光時上傳了23萬個視頻,假如普通人一天做3個視頻,需要連續213年才能做出23萬個視頻。

後來上傳了30萬個視頻
不管產業再怎麼升級,也跑不贏營銷號的步伐。
也有人願意跟營銷號槓到底,像是旅遊博主“太梓”,發現自己的原創內容被營銷號盜用,成立“不要偷我知識產權服務有限公司”,三年內打了1000多場版權官司。

就像西西弗斯推石頭,明知前方有無盡的阻礙,但從不放棄,荒誕同時值得尊敬。
03
提升垃圾內容的“品質”,全靠AI
最近有個神奇的社交軟件Butterflies,在這裏,AI才是本體,人類淪為工具人。

人類有什麼用?打開軟件、1分鐘製作出AI角色,然後化身攝像頭,欣賞AI們的豐富生活。
AI在做什麼?瘋狂發貼、發照片、轉評贊,用996/007的強度享受賽博世界的美好生活。
在Butterflies裏轉一圈,有種牛馬打工人圍觀財富自由人羣吃喝玩樂的美。

也有“務實”的AI在銀河下敲代碼,人家AI打工也能頗具情調
不怕AI玩得比自己花,就怕AI跑出它們的圈子,到人類世界裏秀操作。
上個月,谷歌的AI成了全世界的樂子。搜索“批薩上的奶酪掉下來怎麼辦”,谷歌AI會説“塗上無毒膠水”。
如此離譜的回答,來源於Reddit的一篇上古老帖,帖子作者明顯是在巨魔開玩笑,但被谷歌AI當真了。
更離譜的是,真有人買了無毒膠水,按照谷歌AI的配方做了批薩,而且吃了。

省流版本:味道很好,人還健在
谷歌AI犯傻之後,字節的豆包大模型也整了個活,有人發現能在搜索引擎裏能找到豆包和用户之間的對話。
我們試着找當時的對話截圖,但下手晚了,相關網頁已經下架。
意外收穫還是有的,“豆包 搜索引擎”這個關鍵詞已經被SEO污染,點進去是一些賣奇怪器械的網站……

為什麼當時能搜到豆包和用户的對話?當時豆包大模型默認勾選“允許分享內容被搜索引擎收錄”,這才導致搜索引擎裏全是豆包。

這個問題已經被修復
ChatGPT也有類似的功能,目標是方便用户分享內容。雖然豆包不是故意的,但網民們坐不住了,一股不安感湧上心頭。
谷歌AI和豆包大模型的UI很明顯,普通人能一眼識別,從而對它們的內容產生質疑。但有沒有一種可能,AI生成的內容故意把自己偽裝得人畜無害,故意混進我們的信息流裏?
這種擔憂,早已成真了。
基於Transformer架構的各種AI,最擅長一本正經胡説八道,簡直是編寫營銷號的最佳工具。閲讀這種工具生成的文字,感覺就像穿了冰絲內褲一樣,絲滑流暢。

有人出售專門的營銷號工具,也能一鍵生成視頻
但你細品,就能發現一段幾百字的小作文,其實毫無信息量,全是同義反復。見得多了,也就能大概猜出這是AI生成的內容。
實在分辨不出來,也有一些AI工具能輔助判斷某段文字是不是AI生成。
AI正在判斷AI生成的內容是不是AI生成,有點繞口令,而且挺魔幻的。
更早以前,微信裏就有很多疑似AI生成內容的公眾號,它們似乎瞄準中老年人羣,主打賽博飛昇的胡言亂語。
像是“地球越級升級”這個號,簡直是神幻的集大成,托爾金、喬治·馬丁他們都不敢這麼寫。
節選一段內容給大家品品:

這類帳號下邊,很多頂着中老年頭像的人頻繁打賞。

其實想想,挺失落的。以前的騙子雖然可惡,但他們畢竟是有血有肉的人啊。現在連騙子都進化成硅基生命了,這個世界人情味,真是一代不如一代。
AI強勢逐漸入侵互聯網,大型多人在線狼人殺即將開始。
更麻煩的是,玩狼人殺,我們能從玩家的面部表情裏尋找蛛絲馬跡。但AI“真人出鏡”,真假難辨。
幾天前,馬斯克的深度偽造視頻頻繁出現在YouTube直播平台,偽·馬斯克號稱直播送比特幣,誘導不明所以的吃瓜老外點擊鏈接,到騙子網站裏當韭菜。

剛剛過去的618電商促銷,有一堆數字人直播帶貨,它們是真007,永遠不需要休息。但畢竟技術有限,當你發彈幕跟它們互動的時候,就像卡殼了一樣,過半分鐘才能收到一個文不對題的回覆。
這些數字人直播間剛剛上線的時候,成交額爆表,但沒過幾天,成交額就跌到真人直播的20%。人味,仍然是直播帶貨的必備要素。

“兄弟宇宙創始人"也加入數字分身的行列
經常關注科技內容的人,大概能判定哪些是AIGC。但對於大多數人來説,信以為真才是常態。
在2021年,“俄羅斯娜娜”和它的三姑六婆們集體攻佔短視頻平台。這些“偽人集團”操着塑料俄普,一口一個“中國的兄弟姐妹們,你們好”,瘋狂帶貨賺錢。
其實它們根本不是俄羅斯人,而是100%原生態的本地老鄉,利用AI換臉技術,把自己偽裝成俄羅斯人的臉型,收割國人的愛國情懷。

“俄羅斯娜娜”的真身,其實是個男人
這種低級騙局能奏效,恰好説明大多數人分不清AIGC。
説了這麼多AIGC的負面案例,好像AI都是洪水猛獸。其實不然,AI做好事的潛力無限大。
前幾天看了一篇報道,一位醫生髮現網上有很多健康科普自媒體傳播錯誤信息,但自己工作太忙,沒時間一一糾正。
於是醫生在一家數字人公司製作了“分身”,只需要確保文案准確,讓“分身”出鏡生成視頻,極大提高傳播正確醫學科普的效率。
技術本身沒有對錯,有錯的是想用技術作惡的人,以及背後的利益鏈條。
現在的互聯網上,真實和虛假的信息混在一起,甚至虛假比真實更容易接受。不擦亮雙眼,我們很容易陷入內容農場、營銷號的泥潭裏。
然而真實情況是,完蛋,我們已經被泥潭包圍了。