移動整個鏈條:網絡鏈數據收集術_風聞
观察者网用户_241051-2020-07-03 13:51
摘要:雖然大多數網絡研究涉及收集網絡數據,但只有一小部分工作側重於收集網絡鏈數據。收集網絡鏈數據可以獲得未被觀察到的全網路徑,用以捕獲分離程度或搜索過程之類的現象。本期編譯的文章提出了一個網絡鏈數據收集的設計框架,利用這個框架描述了定性和定量收集網絡鏈數據過程,總結了這些數據收集工作的經驗教訓,討論了提高網絡鏈數據質量的收集策略,為今後涉及網絡鏈數據收集的研究提供了建議。
這是社論前沿第S1684次推送
微信號:shelunqianyan
介紹
現有大量關於收集網絡數據方法和最佳實踐的文獻。然而,只有少數有影響力的研究涉及到網絡鏈數據的收集。網絡鏈數據可以通過許多不同的方式收集,但都涉及到一個未觀察到的整個網絡中的路徑。因此,在收集整個網絡數據不切實際的情況下,網絡鏈數據能夠捕捉到個人之外的社會結構特徵。
以往網絡鏈數據收集的研究強調了網絡鏈數據收集可以採取的一系列設計。然而,這些最佳實踐往往是抽象的,並沒有在實踐中被操作和評估,這限制了它們的應用價值。作者借鑑以往的網絡鏈數據收集研究和綜述,提出了網絡鏈數據收集的設計框架,討論了具體的數據收集策略,反思了哪些是有效的,哪些是無效的。
已有數據的收集設計
現有的網絡鏈數據收集設計有六種。
第一種是經典小世界設計。Milgram(1967)的小世界實驗為確定網絡鏈數據收集的關鍵設計提供了一個起點,在不同的環境和不同的啓動者和目標人羣中被多次使用。
第二種是改良版小世界設計。電子通信技術的傳播使得改良後的小世界設計成為可能,這種設計在幾個重要方面與經典設計不同。最與經典設計不同的是,改良後的設計利用電話或互聯網作為收集數據的模式,這樣就不需要實物文件了。此外,在改良後的設計中,每一個環節都不是依靠鏈式參與者相互聯繫。研究者直接參與數據收集過程,使得其他設計的修改更加實用。
經典的和改良的小世界設計是高度結構化的。與此相反,第三種隨機遊走設計在很大程度上是非結構化的。隨機遊走設計最顯著的特徵是它沒有目標。和經典的小世界設計一樣,數據收集的模式仍然是物理性的。但是並沒有特定的目的地,參與者也沒有得到選擇中間人的指示,只是在範圍上限制中間人必須在焦點環境內。因此,隨機遊走的設計並不是為了評估啓動者和目標之間的關係距離,而是為了追蹤一個有界環境內的無定向擴散。
第四種關係鏈設計是另一種非結構化設計,但其方法和目的明顯不同。關係鏈設計並不關注具體的啓動者或目標,而是追蹤參與特定互動形式的人的序列,包括研究合作的形成或學校項目的信息交流。數據收集的模式涉及定性訪談,其重點不是訪談參與者本身,而是他們對這些過程的回憶,從中重建網絡鏈。這些訪談數據所產生的網絡鏈可能包含受訪者,也可能不包含受訪者。與其他限制參與者只識別一箇中間人的設計不同,訪談參與者可能在鏈中的一個步驟就識別多箇中間人。
第五種搜索設計代表了結構化網絡鏈設計和非結構化網絡鏈設計的中間點。雖然搜索設計在很多方面與小世界設計十分相似,但與小世界設計以特定個體為目標不同,搜索設計以某類個體為目標。在實踐中,採用搜索設計的研究範圍很窄,試圖瞭解特定環境中的成員如何定位一個具有特定技能或信息的人。搜索鏈混合設計放寬了上述一些限制,保留了搜索設計的個人目標類型,但採用了關係鏈設計的過程導向的重點和定性的數據收集模式。
最後一種專業設計包括對經典小世界設計的修改,以研究特定的方法問題。這種設計並沒有得到網絡鏈數據,而只是得到了一大組一步鏈末梢。從這些數據中,可以構建真實的社會網絡和每對不認識的人之間隱含的網絡鏈,然後檢查了物理距離和鏈距離的差異。
構建集成設計框架
收集網絡鏈數據包括要求啓動者確定一個或多個可能知道目標的中間人,並對每個指定的中間人重複這一過程(見圖1)。這個過程產生了網絡鏈數據,它捕捉了一個未被觀察到的整個網絡中的路徑,該路徑從一個啓動節點開始,(可能)以一個目標節點結束,並由中間節點組成。

圖1 網絡鏈數據採集
(温馨提示:點擊查看大圖)
該鏈可以有四種結果:如果最終節點是目標節點,則該鏈是完整的;如果已知最終節點不是目標節點,則該鏈是死衚衕;如果在該鏈的前面出現了一個被命名的中間人,則該鏈是循環的;如果最終節點是未知的,因為一箇中間人沒有命名另一箇中間人,則該鏈是刪減的。鏈的長度是指它所包含的中間人數量,只能直接計算完整鏈和不完整鏈的長度,但可以估計刪減鏈的長度。
首先,目標的特殊性既影響鏈合併的可能性,也影響可以觀察到的結果類型。當目標是一個具體的個體時,由獨立的啓動者發起的鏈更有可能共享中間人(即會合並),而目標比較寬泛或目標不明確的鏈則不太可能共享中間人。
第二,限制每個啓動者或中間人只識別一箇中間人,保證每個啓動者只與一個鏈相關聯(即沒有分支)。
第三,當中間人的選擇範圍受到限制時(如在一個組織內部),鏈會比範圍不受限制時短,會涉及更多的共享中間人。
第四,向中間人提供網絡鏈信息會影響循環的可能存在。如果已知完整信息,則不太可能存在任何長度的循環,而如果只知道發送方,則不太可能存在2個循環(即,互換)。然而,儘管提供鏈信息可以減少循環的可能性,因為中間人提名指令通常不明確禁止中間人選擇先前的中間人作為未來的中間人,循環仍然是可能的。
最後,當啓動者或中間人不選擇下一個中間人的原因不明時,就可能無法區分因無回應而終止的鏈和因死衚衕而終止的鏈,因此是不完整的。
數據收集注意事項
作者使用MiSPI(密歇根州學校項目信息)項目作為案例研究來檢查網絡鏈數據收集過程。重點放在收集網絡鏈數據的設計和策略上,這些數據涉及收集未觀察到的整個網絡中的路徑。網絡鏈數據可以是定量的或定性的,並且提供了相對於自我或整個網絡數據的一些優勢。作者概述了收集網絡鏈數據時必須考慮的一些有關設計的注意事項,以及在MiSPI項目中成功收集網絡鏈數據的策略。
過去使用網絡鏈數據進行的研究,發現在數據收集中存在多個決策點,這些決策點會導致設計的變化。將這些決策點整合到一個框架中,我們確定了七種類型的網絡鏈數據收集設計,它們由七個決策點來區分:
(1) 是否以及如何指定目標;(2)每個受訪者可以選擇多少箇中間人;(3)受訪者可以選擇的中間人是否有範圍限制;(4)是否嘗試確認中間人和受訪者之間的關係;(5)數據收集模式;(6)中間人是否知道網絡鏈的信息;以及(7)起始鏈或中間鏈終止時是否提供原因。
七種可用的設計對於可以收集的網絡鏈數據的類型以及可能具有的特徵都有不同的含義。這表明研究人員收集網絡鏈數據的方式有很大的靈活性,但研究人員也必須仔細考慮他們選擇的設計與他們的研究問題和分析需求的匹配。
例如,因為經典和改進的小世界設計定義了特定的個人目標,所以它們非常適合回答這樣一個問題:兩個互不認識的個人之間有多少度的分離?相反,由於搜索和搜索-混合設計僅定義了一種類型的目標,因此它們非常適合回答這樣一個問題:個人如何在其網絡中搜索特定類型的信息或資源?
數據收集策略
收集網絡鏈數據是複雜的,因為它不僅涉及到從啓動者那裏收集信息,而且還涉及到從一系列中間人那裏收集信息。因此,除了專門的設計注意事項外,這種形式的數據收集可能需要專門的策略。考慮到數據的關係性質,缺失是網絡分析中的一個常見問題。網絡鏈數據也不例外,因為鏈上任何中間人的缺失都會導致數據被審查。因此,在收集這些數據時,實施提高參與者響應率的策略至關重要。根據收集MiSPI項目網鏈數據的經驗,作者提出三點建議:
建議1:採用典型的調查策略來提高回覆率,包括提醒和激勵措施。提高回覆率的典型調查策略包括向參與者發送提醒和為完成調查提供激勵措施。從MiSPI項目中獲得的每週回覆率數據表明,電話提醒使參與率明顯提高。在收集網絡鏈數據時,採用這些策略尤為重要,因為它們可以減少刪減鏈的數量。然而,由於這些策略必須在每一次數據收集時採用,它們也會導致網絡鏈數據收集所需的時間大大超過其他類型的網絡數據收集。
建議2:在可能的情況下,向中間人披露推薦人程序。在設計網絡鏈條數據收集時,一個考慮因素是,是否向中間人透露鏈條的信息。在MiSPI項目中,在可能的情況下,向中間人推薦他們可以作為提名的個人是特別有幫助的。具體地説,知道推薦人名字的中間人比那些不知道推薦人名字的中間人更有可能參與這項研究。然而,在招聘中加入這種個人風格確實需要一些超前的規劃。實施這一建議可能會引發倫理問題。在MiSPI項目中,違反保密性的風險是最小的,因為推薦人認為他們指定的中間人是值得信賴的。
建議3:允許答覆者指定組織中間人的名字,並執行將組織領導人歸類為代表的程序。過去大多數網絡鏈數據收集的經驗例子只允許參與者説出個人的名字。然而,特別是當研究人員對了解搜索過程感興趣時,允許啓動者和中間人是組織可能很重要。在這些情況下,通常可以指定一名組織代表作為下一個答辯人,儘管非正式組織(如俱樂部)或超大型組織(如跨國公司)可能會面臨挑戰。來自MiSPI項目的數據表明,這些被認為是領導者的回覆率略低,但總體上仍然很高。
網絡鏈數據以三種主要結果結束:完整鏈(即鏈達到預期目標)、不完整鏈(即鏈未達到預期目標)和刪除鏈(即過早停止數據收集)。與數據收集和分析相關的選擇對區分這些不同的結果具有潛在的影響。根據MiSPI項目網鏈數據的經驗,作者提出兩點建議:
建議4:詢問啓動者和中間人跳過提名問題的原因。他們是否(a)沒有中間人可供提名,或(b)有中間人可供提名,但不願提名。由於啓動者和中間人經常會跳過提名問題,在這些情況下,區分刪減鏈和不完整鏈是很重要的。在MiSPI項目中,增加了一個簡單的問題來收集啓動者和中間人不回答的原因,能夠區分死衚衕式的不完整鏈和刪減的不完整鏈。
建議5:所有長度的循環在網絡鏈數據中都是可能的,而且應該被允許。不完整的網絡鏈以循環結束的情況並不少見,來自MiSPI項目的數據表明,這些鏈可以是任意長度。雖然1次循環可能看起來有違直覺,很可能是測量誤差的結果,但對受訪者的後續採訪證實了1次循環是真實存在的,特別是在搜索鏈中,當受訪者將自己視為權威或與人接觸時。
結 論
網絡鏈數據從20世紀60年代就開始使用。這些數據對於捕捉未觀察到的整個網絡中的分離程度或搜索過程等現象特別有用。然而,改善網絡鏈數據質量的數據收集設計和策略的推薦實踐仍然相對抽象。在本文,作者勾勒出一個設計框架,並描述用於收集高質量網絡鏈數據的具體策略。通過這樣做,鼓勵更多地思考設計決策對收集網絡鏈數據的影響,並在未來對收集這些數據的工作進行更透明的描述。