微辰金服：虛假賬號不斷進化，AI能做的還是有限_風聞

微辰金服-2018-07-25 16:18

2018-07-25

　　你的社交平台擁有多少個粉絲?

　　一千?一萬?還是更多?你知道其中存在多少個“殭屍粉”嗎?

　　微辰金服據悉，近日，據美國權威科技媒體The Information引述研究機構Ghost Data的報告稱，2015年，Instagram平台的殭屍賬號佔比為7.9%，到目前已經攀升至9.5%。Instagram的閲讀用户已經增加到了十億人。根據上述比例，Instagram平台上現在大約有9500萬個殭屍賬號。

　　有媒體評論指出，如此規模的“殭屍賬號”，讓Instagram成為下一個互聯網行業打擊假新聞、假信息和政客營銷的重要陣地。

　　為什麼這麼説，恐怕得看看“網絡水軍”在近些年的“傑作”。 2017 年，至少有 18 個國家在選舉中遭遇了線上操縱和虛假信息策略，包括德國聯邦總統選舉期間社交機器人活躍和垃圾新聞頻出等。

　　顯然，治理“網絡水軍”已成為全球難題。而由於其分散、量大兼具技術隱蔽性，對其的治理更需要講究專業化和智能化。此時，人工智能也派上了用處。

　　道高一尺，魔高一丈，虛假賬號與AI的鬥智鬥勇

　　從創建應用軟件、官方網站或內容傳播平台，到生產具有實質性內容的圖像、視頻或文字，通過或真或假或自動地與用户交互，虛假賬號已經越來越“真實”。就在去年，有研究表明，連人工智能都可以被用來生成複雜的點評信息，而這些虛假的點評不僅機器無法檢測出來，就連人類讀者也分辨不出來。

　　虛假賬號不再“虛假”，整個社交網站都面臨着潛在卻嚴重的衝擊。智能相對論(aixdlun)分析師顏璇梳理了三種智能“鑑粉”方式，分別囊括了用户行為、內容和情感特徵三種形式，試圖解決這一問題。

　　首先是用户行為特徵的分析。這種方式大多依託於爬蟲技術，即通過主動爬取特定微博或者論壇的主體相關的註冊行為、社交行為、轉發與評論等行為 , 從而進行多維特徵向量刻畫。同時，有研究者還採用了隱馬爾可夫模型來對用户行為進行建模，利用模型參數來對用户行為進識別和分類，畢竟“殭屍”掉進了“植物”裏，總是有區別的。

　　這主要是利用賬號之間的社會關係來識別那些“殭屍號”。而面對這種方式，水軍們也“與時俱進”，比如一些職業差評師的賬號在註冊行為上就無懈可擊，他們的賬號一般會同時配備有身份證、用户手持證件照、實名手機號碼卡、實名銀行卡等，還能通過作弊軟件騙過實名認證系統。即使是微博裏的“殭屍粉”，也會存在一些粉絲關係。

　　第一種方式被“見招拆招”，AI也不得不拿出第二種方式，即對內容特徵的分析。基於內容分析的識別技術主要從發帖內容本身切入 ,建立“殭屍粉”、惡意或者美化信息等本體模型, 同時建立敏感語義庫，通過語言特徵統計區分虛假賬號。

　　但是，由於語義領域的不統一性，同一本體在不同領域，甚至同一領域都會存在很多象徵意義的現狀，比如用户在討論某手機時，提到“這手機的上網速度真快”，“快”是一種誇讚，如果説“這手機耗電速度真快”，“快”又變成了一種批評。因此，內容特徵模型在不同的情況、平台上都會有較大的變化，這也造成了AI分析內容特徵進而識別“殭屍粉”的通用性較差的問題。

　　如此來看，基於單一特徵對虛假賬號進行識別還是比較困難的，因此，AI也不得不開始思考第三種方式。第三種方式源於第二種方式，即對內容中情感特徵的分析。

　　有研究者通過分析推特內容中的情感，發現在線社交網絡中的內容創建、傳播與證券市場波動、期貨商品價格及國家、社會重大事件之間有着緊密的聯繫。這也表明情感傾向是社交網站內容中的重要特徵。

　　而水軍也往往帶有強烈的感情色彩(好評或差評)，針對單個發帖的情感傾向性，AI可以設定一個閾值，若對某個主題發表的正面或者負面帖子比例超過設定閾值,，則認為該用户為水軍。

　　但是，用於虛假賬號監測的內容和情感特徵的融合，屬於比較明顯的特徵，而忽視了隱藏式的異常用户，比如用户上傳與文字內容沒有任何關係的圖片，抑或者用户評論情感與用户打分不匹配等新特徵。

　當網友對水軍開始麻木，活着的水軍其實已經死了

　　事實上，網絡水軍要想操作輿論，只需要錯開發帖時間、編輯同一核心的不同文字內容就可以了，雖然這樣做的成本會高一點，但是具體操作起來也不是什麼高難度的事情。如果有人真心實意想要給某個作品一個差評，人工智能還真不能立即判斷出他是真實用户還是水軍。

　　那我們就拿這些虛假賬號沒辦法了嗎?

　　新浪微博裏首個突破一億粉絲的女藝人，我們不會真的相信是有一億個人關注了她;一部好電影上映，眾口皆碑下也不會有人在意零星幾個差評;百分百好評的商品，消費者也會對其持有懷疑;疫苗事件後，網民對調查記者的呼喚，其實是一種自我保護……不得不説，中國的輿論形成和監督機制正在翻新，水軍操縱輿情的力量也越來越弱。

　　以最近的疫苗事件為例，在事件剛爆發時，也不乏一些別有用心的人，整理出一些兒童因疫苗殘疾的圖片，卻不做任何文字説明，引起了許多人的恐慌和憤怒，但是筆者在其中還是發現了許多比較理性的言論，表明疫苗的不良反應也是客觀存在的，這類危言聳聽的做法反而會阻礙健康疫苗在國內的普及。

　　目前，網上對疫苗流向的追問，有關人員的責問，各種po文有理有據，也是眾多網友理性思考後的結果。

　　所以，儘管虛假賬號的痕跡越來越隱蔽，但網民們的理性和成熟也在不斷加快，更多網民也不再盲目輕信，反而會批判式地去看待每一個輿論觀點，從情緒化到更加理智，從感性到理性，社交軟件上的觀點已經越來越多元化，網絡水軍也越來越難以左右輿論走向。