數字足跡:在線社會研究的機遇與挑戰(下)_風聞
观察者网用户_241051-2019-10-19 09:42
編者按
本次推送的是Scott A. Golder 和Michael W. Macy發表的Digital Footprints: Opportunities and Challenges for Online Social Research一文的下篇,上篇主要對在線社會研究的背景、方法的發展和研究的應用方面進行了整理,下篇就相關研究的一些主題和網絡研究所面臨的挑戰進行了論述。
交換、合作和信任
越來越多的研究使用線上數據來解決社會交換中關於信任與合作的長期問題,在這些問題中,交換的價值商品是時間、關注度、信息和地位。State 等人(2012)的研究符合交換理論的一項基本原則,即交換關係趨向於相互平衡。他們發現,“沙發客”以公開好評的方式來回報主人的好客。(注:“沙發客”源於一種新型的網絡互助遊,這些“廉價”遊客通過在線社區尋找免費睡別人家沙發的機會,以減少旅行開支。)
關注度也是社會交換中一種寶貴的資源。Podolny(2001)指出,關注度是他人評判的視角;被有影響力的個人關注,反過來可以提高被關注人的經濟利益,並向其他人發出一個誰值得被關注的信號。線上實驗證實,個人願意用金錢作為回報來換取同齡人的讚賞和關注,即使是人為的(Huberman et al. 2004)。換言之,Huberman的研究項目以在線互動創造的“關注度經濟”為中心,解決了因網上信息量巨大而造成的難題,使關注度變得有價值。然而,關注度是如何被導向或被吸引的,人們知之甚少。
和關注度一樣,信任也是在線互動中特別重要的一種資源,在這種互動中,身份可能是臨時性的,使得信譽信息的可靠性和懲罰騙子的能力受到限制。作為回應,用户已經制定出標準來規範行為,例如要求社區的新成員首先為互動做出保證。
交換理論分析也可以應用於個人關係以及商業和組織關係。Backstrom和Kleinberg(2014)隨機選擇了130萬Facebook成年用户,測試網絡嵌入性對戀愛關係的形成和持久性的影響。令人驚訝的是,他們發現分散性有利於關係成功,而非嵌入性,這與嵌入關係的力量理論相矛盾——但與Burt(1992)的結構洞理論中未被探索過的浪漫含義相一致——人們被那些能填補結構洞的伴侶所吸引。
集體行動和社會運動
許多在線社區依靠大量不相關個體的自願貢獻來運行,這為研究人員提供了一個解決集體行動研究中長期存在的難題的絕佳機會:鬆散的貢獻者是如何形成秩序和共識的?是什麼促使他們為這一公益產品作出貢獻?著名的例子是開源任務組,如維基百科和Linux,以及魔獸世界和Everquest等大型多人在線遊戲。維基百科是一本公開編輯的合作式百科全書,每天由成千上萬的志願者撰寫和編輯。就像線下世界中的許多志願協會一樣,維基百科、Usenet和許多其它在線社區幾乎完全由它們的參與者共同建立,逐漸形成了共同確定和同意的規範性義務和限制,但與其它社區最大的不同之處是,詳細的演變記錄被保存起來以供科學社區研究。
隨着維基百科的發展,其編輯者社區發佈了許多政策來指導撰稿人和解決糾紛,例如要求文章必須從中立的角度寫,並且只有在引用公共資源的情況下才能包含聲明。雖然這些制度安排有助於規範和協調用户行為,但它們也使用户作出貢獻的動機更加令人困惑,因為他們很少有機會利用社區來推廣一個狹隘的觀點。Anthony等人(2009)研究了維基百科的貢獻質量,並提出是“匿名的好人”貢獻了高質量的內容,而Welser等人(2011)指出,維客們自發進入角色,聚焦於“清除破壞行為”和提供專業知識等。
挑戰
隱私悖論
這些新數據使研究人員面臨重重障礙,從數據的有效性和如何取樣,到數據使用有關的倫理問題。在線數據在隱私保護方面表現出一個悖論:在隱私保護方面,數據暴露得太多,但在提供社會科學家所需的人口背景信息方面,這樣的數據又不足以揭示問題。在線數據通常缺少調查研究標準中所需的詳細人口統計信息。如,雖然Twitter數據是公開的,但許多用户提供的是稀少、虛構、不完整或模糊的概要信息,使得研究人員難以將tweets內容或網絡節點屬性與年齡、性別、族裔或地點等基本人口統計指標聯繫起來。在某些情況下,很難説互動對象是不是人;垃圾郵件賬户(為發送營銷或其它不受歡迎的信息而創建的假Twitter賬户)的出現率越來越高,儘管在垃圾郵件檢測方法方面取得了進展(Yardi et al. 2010),但垃圾郵件發送者設法繞過這些方法,繼續進行“軍備競賽”。隨着垃圾郵件發送者變得越來越有經驗,社會科學家很難在沒有專門技術培訓的情況下清理他們收集的數據。
儘管如此,這些限制因素的解決方面正在取得迅速進展。如Compton 等人(2014)演示瞭如何使用標籤傳播算法在幾公里內定位大多數Twitter用户,Jernigan 和 Mistree(2009) 展示了Facebook上的內容如何被用來推斷更多的用户屬性,包括年齡、性別、性取向和政治面貌。
這些進步説明了困境的另一面——在線數據可能不夠私密。這些新的數據來源提出了有關如何保護個人隱私的具有挑戰性的程序、法律和倫理問題,這些問題超出了本綜述的範圍,但大量研究表明,匿名化或數據加密並不能有效保護隱私,因為有時可以利用個人以自我為中心的網絡或物理移動模式的獨特屬性進行反向設計。對私有數據的訪問也是一項重大挑戰。大多數在線數據都是私有企業實體擁有的,出於對保護用户隱私的擔憂,這些實體可能會限制對大部分用户的訪問。
測量問題
雖然從文本中識別情感和觀點的進展很快,但只能通過人們的行為表達間接測量其內心狀態。例如,心理詞彙可以用來衡量全球範圍內情感節奏的表達,但這些方法不能解釋表達和體驗之間的時間滯後。此外,異步通信允許用户反省和修改他們所寫的內容,因此看似潛在精神狀態的自發表達可能會被自我審查和深思熟慮所取代。
如上所述,網絡傳染的所有觀察性研究中的一個重要侷限性是,無論線上還是線下,都很難對同質性和傳染性作出區分。同質性是指通過各種選擇機制,社會關係更有可能存在於具有相似屬性的個體和暴露的環境之間。研究人員需要避免假設觀測到的網絡自相關再效應對傳染效應有影響,並且認識到相鄰節點之間的相似性可能導致影響和選擇的相互增強效應。一種解決辦法是進行控制實驗,對可能傳染的情況進行處理。
線上和線下網絡研究中的另一個基本問題是決定社會關係構成的是什麼。在基於自我網絡的調查研究中,爭論的焦點是如何讓被調查者挑選一位朋友。在基於電話記錄、電子郵件流量或Twitter消息的在線通信網絡研究中,一個關鍵問題是如何確定交換的類型和數量(如電子郵件),以表明是否存在持久的社會關係。
一個相關議題是,研究中對聯繫建立的標準是否與行為者對社會關係概念的理解相一致。這些問題也出現在線下網絡的研究中,特別是關聯網絡,為此學者做出了一些嘗試來確定邊緣網絡是否對應於實際互動,如相似性、結構和親切感的規律性,以及工具性和情感性關係的指示。
網絡世界是一個平行宇宙嗎?
研究人員還面臨着將線上行為推廣到線下的挑戰。線上互動與線下互動在重點和表現方面不同,包括沒有地理和時間限制的面對面交流。如,推遲迴覆電子郵件、短信或回應狀態更新的能力,為人們提供了一個自我反省的機會,使人們對自我展示的內容可以進行更為慎重和更具策略性的思考。一些在線平台允許用户匿名,讓後者可以自由創建一個全新角色,這讓人們對人口特徵統計數據的可信度產生了懷疑。從某種程度上而言,匿名性的出現允許或鼓勵了在線對話中許多惡毒言論的產生,但在線下世界這一般是不可能發生的。
數字鴻溝引起了人們對從線上到線下人羣的普遍關注。與普通民眾相比,線上羣體往往比普通民眾更年輕、受教育程度更高、更富裕,這也引發了關於再生產甚至擴大社會分層潛力的重要問題。即使在技術可得的情況下,利用這種技術的技能仍然分佈不均。
方法、技能和培訓
對於社會科學家而言,線上研究的一個主要障礙是需要先進的技術訓練來收集、存儲、操作、分析和驗證大量的半結構化數據,如由數億社交媒體用户生成的文本。此外,還需要先進的編程技能,以便與專業或定製硬件進行互動,在由數百個跨越全球的節點組成的計算網格上執行任務。因此,對網絡行為和互動進行第一批研究的,一直以物理、計算機和信息科學家為主,他們可能缺乏必要的理論基礎,無法知道該在哪裏尋找、該問什麼問題或結果可能意味着什麼。短期內,多學科合作可能會非常有成效,但長期的解決方案是,通過提供在線研究所需的技能培訓,使社會科學學位課程適應大數據時代。
作者列舉了一些網絡研究所需要的技能,如編程界面的使用,非結構化數據和嵌套數據結構的操作化,通過創建網頁和數據庫來收集和存儲調查或在線實驗,大數據庫的操作與存儲,機器學習、情感分析和主題建模。
這些方法在社會科學中沒有獲得廣泛應用的原因之一是,目前許多應用都是非理論性的,它們更重視預測未來觀測的能力,而不是從理論上檢驗假設。然而,我們不應因噎廢食。在線數據為描述性和分析性研究開闢了變革的可能性,但如果沒有計算機科學家開發的自動化數據管理和編碼工具,對大量非結構化數據的分析仍將是大多數社會科學家所無法企及的。雖然目前很少有社會科學系能夠將這些技能納入方法課程,但有興趣的學生可以直接到計算機和信息科學系接受專門培訓。
總結
在信息理論領域的早期, Claude Shannon(1956)在“The Bandwagon”一文中警告説,人們對這個新領域的廣泛興趣將產生大量低質量的工作,但不應導致研究界得出這是其固有侷限性的結論。相反,應該把它看作是一種告誡,把重點放在進行更嚴格的研究上。Shannon的建議也適用於即將到來的網絡社會科學時代。在微觀層面和全球範圍內實時觀察人類行為和社會互動的前所未有的機遇,正引起科學家們的廣泛關注,他們掌握了挖掘這些數據的必要技能,但並不總是具備指導探究所需的理論背景。這些開創性的研究不應被理解為可以從在線研究中獲得什麼的證據,而應被視為一門新的社會生活科學所面臨的巨大機遇的證據。

文獻來源:
Scott A. Golder and Michael W. Macy(2014):Digital Footprints: Opportunities and Challenges for Online Social Research.Annual Review of Sociology,40:129-152.