微辰金服:虛假賬號不斷進化,AI能做的還是有限_風聞
微辰金服-2018-07-25 16:18
你的社交平台擁有多少個粉絲?
一千?一萬?還是更多?你知道其中存在多少個“殭屍粉”嗎?

微辰金服據悉,近日,據美國權威科技媒體The Information引述研究機構Ghost Data的報告稱,2015年,Instagram平台的殭屍賬號佔比為7.9%,到目前已經攀升至9.5%。Instagram的閲讀用户已經增加到了十億人。根據上述比例,Instagram平台上現在大約有9500萬個殭屍賬號。
有媒體評論指出,如此規模的“殭屍賬號”,讓Instagram成為下一個互聯網行業打擊假新聞、假信息和政客營銷的重要陣地。
為什麼這麼説 ,恐怕得看看“網絡水軍”在近些年的“傑作”。 2017 年,至少有 18 個國家在選舉中遭遇了線上操縱和虛假信息策略,包括德國聯邦總統選舉期間社交機器人活躍和垃圾新聞頻出等。
顯然,治理“網絡水軍”已成為全球難題。而由於其分散、量大兼具技術隱蔽性,對其的治理更需要講究專業化和智能化。此時,人工智能也派上了用處。
道高一尺,魔高一丈,虛假賬號與AI的鬥智鬥勇
從創建應用軟件、官方網站或內容傳播平台,到生產具有實質性內容的圖像、視頻或文字,通過或真或假或自動地與用户交互,虛假賬號已經越來越“真實”。就在去年,有研究表明,連人工智能都可以被用來生成複雜的點評信息,而這些虛假的點評不僅機器無法檢測出來,就連人類讀者也分辨不出來。
虛假賬號不再“虛假”,整個社交網站都面臨着潛在卻嚴重的衝擊。智能相對論(aixdlun)分析師顏璇梳理了三種智能“鑑粉”方式,分別囊括了用户行為、內容和情感特徵三種形式,試圖解決這一問題。
首先是用户行為特徵的分析。這種方式大多依託於爬蟲技術,即通過主動爬取特定微博或者論壇的主體相關的註冊行為、社交行為、轉發與評論等行為 , 從而進行多維特徵向量刻畫。同時,有研究者還採用了隱馬爾可夫模型來對用户行為進行建模,利用模型參數來對用户行為進識別和分類,畢竟“殭屍”掉進了“植物”裏,總是有區別的。
這主要是利用賬號之間的社會關係來識別那些“殭屍號”。而面對這種方式,水軍們也“與時俱進”,比如一些職業差評師的賬號在註冊行為上就無懈可擊,他們的賬號一般會同時配備有身份證、用户手持證件照、實名手機號碼卡、實名銀行卡等,還能通過作弊軟件騙過實名認證系統。即使是微博裏的“殭屍粉”,也會存在一些粉絲關係。
第一種方式被“見招拆招”,AI也不得不拿出第二種方式,即對內容特徵的分析。基於內容分析的識別技術主要從發帖內容本身切入 ,建立“殭屍粉”、惡意或者美化信息等本體模型, 同時建立敏感語義庫,通過語言特徵統計區分虛假賬號。
但是,由於語義領域的不統一性,同一本體在不同領域,甚至同一領域都會存在很多象徵意義的現狀,比如用户在討論某手機時,提到“這手機的上網速度真快”,“快”是一種誇讚,如果説“這手機耗電速度真快”,“快”又變成了一種批評。因此,內容特徵模型在不同的情況、平台上都會有較大的變化,這也造成了AI分析內容特徵進而識別“殭屍粉”的通用性較差的問題。
如此來看,基於單一特徵對虛假賬號進行識別還是比較困難的,因此,AI也不得不開始思考第三種方式。第三種方式源於第二種方式,即對內容中情感特徵的分析。
有研究者通過分析推特內容中的情感,發現在線社交網絡中的內容創建、傳播與證券市場波動、期貨商品價格及國家、社會重大事件之間有着緊密的聯繫。這也表明情感傾向是社交網站內容中的重要特徵。
而水軍也往往帶有強烈的感情色彩(好評或差評),針對單個發帖的情感傾向性,AI可以設定一個閾值,若對某個主題發表的正面或者負面帖子比例超過設定閾值,,則認為該用户為水軍。
但是,用於虛假賬號監測的內容和情感特徵的融合,屬於比較明顯的特徵,而忽視了隱藏式的異常用户,比如用户上傳與文字內容沒有任何關係的圖片, 抑或者用户評論情感與用户打分不匹配等新特徵。
當網友對水軍開始麻木,活着的水軍其實已經死了
事實上,網絡水軍要想操作輿論,只需要錯開發帖時間、編輯同一核心的不同文字內容就可以了,雖然這樣做的成本會高一點,但是具體操作起來也不是什麼高難度的事情。如果有人真心實意想要給某個作品一個差評,人工智能還真不能立即判斷出他是真實用户還是水軍。
那我們就拿這些虛假賬號沒辦法了嗎?
新浪微博裏首個突破一億粉絲的女藝人,我們不會真的相信是有一億個人關注了她;一部好電影上映,眾口皆碑下也不會有人在意零星幾個差評;百分百好評的商品,消費者也會對其持有懷疑;疫苗事件後,網民對調查記者的呼喚,其實是一種自我保護……不得不説,中國的輿論形成和監督機制正在翻新,水軍操縱輿情的力量也越來越弱。
以最近的疫苗事件為例,在事件剛爆發時,也不乏一些別有用心的人,整理出一些兒童因疫苗殘疾的圖片,卻不做任何文字説明,引起了許多人的恐慌和憤怒,但是筆者在其中還是發現了許多比較理性的言論,表明疫苗的不良反應也是客觀存在的,這類危言聳聽的做法反而會阻礙健康疫苗在國內的普及。

目前,網上對疫苗流向的追問,有關人員的責問,各種po文有理有據,也是眾多網友理性思考後的結果。
所以,儘管虛假賬號的痕跡越來越隱蔽,但網民們的理性和成熟也在不斷加快,更多網民也不再盲目輕信,反而會批判式地去看待每一個輿論觀點,從情緒化到更加理智,從感性到理性,社交軟件上的觀點已經越來越多元化,網絡水軍也越來越難以左右輿論走向。