陳根:匿名也不能保護隱私?_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2022-02-16 11:56
文/陳根
現代網絡瀏覽器,大多數都增加了隱私瀏覽模式來瀏覽網頁,旨在保護用户隱私。顯然,隱私瀏覽是一種非常有用且方便的工具,可用於快速瀏覽會話,不會在你的計算機上留下痕跡。它將保護用户的隱私免受使用你計算機的其他人的侵害,並減少你在訪問網站時透露的一些有關用户自己的信息。
但事實上,隱私瀏覽不會讓用户真正匿名,也不會保護用户免受監視和大型技術窺探。近日,一項發表於《自然·通訊》的研究指出,人們在互聯網所留下的互動數據即使匿名也能被用於識別個體身份。
其中,研究人員收集了4萬多手機用户的匿名信息,主要是用户在通訊應用和其他平台上與他人的互動信息。他們還開發了一種基於深度學習的模型,並用這個模型分析收集到的數據,以尋找個體的互動模式。

**結果發現,該模型能基於個體的直接(1級)互動網絡識別出15%的人,且能基於個體的2級互動網絡(與目標個體相隔1人的個體互動)識別出52%的人。**此外,20周後,研究人員還能用個體的2級互動網絡識別出24%的人。
事實上,英國帝國理工學院的Yves-Alexandre de Montjoye及同事開發了一種統計方法,能夠準確估算通過匿名數據集正確地重新識別個體身份的可能性。研究****發現,只需要知道少數幾個屬性,如郵政編碼、出生日期、性別和子女數量,一般就能夠以高可信度重新識別出個體身份——即使數據集是不完整的。
這一結果在2018年轟動全球的“Facebook數據門”事件也可以被確認。彼時,8700萬Facebook用户的個人數據被出賣給一家叫做“劍橋分析”的公司,劍橋分析的“種子用户”來自一款發佈在Facebook上的心理測試app,這個心理測試通過分析點贊等社交行為,給一個人進行心理畫像。
每個美國人身上有5000個信息點,基於這些信息點,結合心理學分析,就足以建構一個人的性格模型。分析10次點贊行為,算法對你個性的分析就能比你同事更準確。只需要68個“贊”,就可以估計出用户的膚色(準確率95%)、性取向(準確率88%)、黨派(共和黨或者民主黨,準確率85%)。有150個點贊數據,對你的瞭解程度可以超過你的父母。超過300個點贊數據,對你的瞭解就會超過你的伴侶。
在這樣的數據分析下,也就不難理解為何匿名還能泄露出一個人的數據信息。根據此次結果,研究人員認為,匿名化、非連接互動數據或具有長期可識別性,這可能對隱私保護條例的遵守具有啓示意義。他們認為,接入控制和隱私增強系統這類安全措施或能防止這種個人身份被識別的情況發生。