阿里巴巴開始“死磕”你朋友圈的謠言了!_風聞
差评-差评官方账号-2019-03-01 08:26
文/差評君
不知道從什麼時候開始,我們的生活中充滿了謠言。
這些謠言涉及的領域五花八門,內容往往危言聳聽。
差評君以前就闢過一個謠,微博上的一個 “ 測試 ” ,搞的全網壓力山大。
差評君查了查,發現只是視錯覺而已,無他。
但對於大多數人來説,看到每一條消息都去百度一下操作成本太高了,謠言該傳還是得傳。。。
而且現在的謠言都是真假摻半,難以分辨。
到最後,我們父母輩的朋友圈很多都是這樣的⬇️
在差評君看來,謠言這東西會扭曲人們的認知,尤其是那種 “ 生病自查,不用問醫生 ” 的養生謠言,是非常害人的事物。
在地球的另一側,一些研究者也這麼認為。
還記得阿里巴巴在2017年末成立的科研機構 “ 達摩院 ” 嗎?
最近,在美國西雅圖的達摩院研究所裏,有一位學者 -- 李泉志搗鼓出了個 “ AI 謠言粉碎機 ” ,通過現代科學的方式來淨化我們的信息:
用 AI 來粉碎謠言。
李泉志在加入達摩院之前,在著名新聞社 -- 路透社工作過,他的工作內容是用機器篩選消息來給記者提供線索。
也就是説,他本來就是職業在網絡上篩選信息的 ~
如今在達摩院,李泉志把這個技術結合自然語言處理技術 ( NLP ) ,成功做出了一套篩選謠言的模型。
差評君有幸採訪了這位研究者,他提到了現在謠言主要傳播途徑來自社交媒體,因此 “ 謠言粉碎機 ” 這個模型目前主要功能也是識別社交媒體上的假新聞。
推特上的假新聞例子
作為一個人工智能, “ 謠言粉碎機 ” 識別方式非常地牛逼。
首先, AI 會追溯消息的最初來源,查一查可信度。
比如查一查最早發出消息的人的公開社交消息歷史,看看他是不是製造謠言的 “ 慣犯 ” ;
或者查一下消息中附帶的鏈接網站可信度,檢驗源頭。
其次,真的去核實謠言裏的知識點。
有些新聞看起來像假的,實際上是真的
AI 可以通過 NLP 從消息當中提煉出知識點,然後聯網通過知識庫去核實。
人類自然也可以做到上述兩點:溯源和查資料,但這是一件極其耗費精力和時間的事情。
最後, AI 還可以做到人類難以完成的事情:深度分析傳播路徑。
很多謠言一開始並不是謠言,但是在社交媒體上發言的個體往往會簡化或者強化一條消息裏的內容,佐證自己想要表達的觀點。
於是一條消息經過 N 手傳播以後。。。可能連最開始的消息發佈者都認不出來了。
“ 謠言粉碎機 ” 的 AI 在追溯一條消息時,會對傳播路徑上經手過的個體進行 “ 畫像 ” ,然後對每一次 “ 再傳播 ” 作一個評價。
比如一條養生類的知識被一個人轉發, AI 根據這個人的 “ 背景歷史分析 ” 判斷出是個有醫學背景的大佬,由此可以判斷消息大概率是真的。
學者李泉志還告訴差評君,理論上來説如果網絡實名化普及率夠高,AI 可以綜合各平台信息對一個人做分析。
考慮到從 2015 年開始網絡造謠被納入了刑法,這套系統到了警察叔叔手裏可能真的能封殺謠言。。。
有趣的是,在研究過程中存在一些我們傳統意義上認為機器難以搞定的點,例如許多人在表達過程中會説反話諷刺,或者用上情緒化的語言。
以往的程序也許確實沒辦法搞定這些難點,但 “ 謠言粉碎機 ” 作為訓練有素的 AI 卻很輕鬆。
泉志告訴差評君,他們在機器學習過程中,用了大約 2 億條推特文章,以及上百萬條網絡新聞。。。這個閲讀量比差評君一輩子看過的字兒都多。
因此 AI 可以做到人類做不到的事情:用極短的時間和極高的準確率,識別謠言。
事實上,這樣的事情全世界都在做,但是 “ 謠言粉碎機 ” 卻做到了最好。
在最近剛結束的自然語言處理領域的權威比賽,全球語義測試 SemEval 中,主辦方給來自各大知名大學和研究機構的參賽者提供了 470 多條是社交媒體上的新聞,以及留言轉發數據,讓他們判斷真假。
泉志的 “ 謠言粉碎機 ” 的假新聞識別率達到了 81% ,創造了記錄。
當然,這套系統過於強大,泉志也表示如果不當使用還存在隱患:
其中通過語言處理來做用户畫像分析的能力,也許會被一些機構利用起來做精準投放。
但更多的是好的方面,比如説哪怕不用來識別新聞,拿來甄別論文抄襲也行。
而且現在的互聯網方便消息傳播的同時,也放大了謠言的危害。
因而獲取即時準確的信息是互聯網時代的人類訴求,研究出成熟破解謠言以及假新聞的工具也算是為全人類做出貢獻。
而達摩院這樣的機構,就有着互聯網公司 “ 解決需求 ” 的思路,吸納像李泉志一樣的學者,用科研手段來解決人類問題。
這對可能對全人類都是一件有益的好事。
“ 造謠要坐牢的! ”