中國性學第一人: 國人生活是怎麼被篡改為數據的? | 文化縱橫_風聞
文化纵横-《文化纵横》杂志官方账号-2021-06-25 20:28
潘綏銘 | 中國人民大學社會學系
(本文原載《新視野》2016年第3期,作者潘綏銘曾任中國人民大學性社會學研究所所長、社會學系教授,主要從事社會學研究方法、性社會學和性別人類學研究,被譽為“中國性學第一人”)
近年來,對於大數據已經出現了盲目崇拜,就是無質疑、不反思地跟風頌揚和無限拔高。本文不涉及任何自然科學領域中的大數據及其應用,僅討論一個根本問題:大數據能夠套用到對於人類的研究中嗎?
對這個問題,我國學術界雖然也出現了一些質疑,但是不僅寥若晨星,而且在學理上也主要是在可操作性的層次上爭論,並沒有擊中要害。其實,大數據最值得質疑的,既不是其定義,也不是其功能或意義,還不是方法論層次上的“以相關分析取代因果分析”,而是**“一切皆可量化”**這個核心口號和基本理論。它表述了大數據的三層意思:其一,沒有量化,就沒有數據,更不可能有什麼大數據;其二,物質世界當然是可以被量化的,但是如果僅限於此,那麼所謂的大數據就僅僅是數量的增加,性質毫無改變,純屬炒作,例如天氣預報一直就在分析海量的數據,卻並沒有以大數據自居,更沒有形成崇拜;其三,現在的大數據之所以被崇拜,要害其實只有一點:把人類的行為及其結果,也給量化了,而且號稱無所不包。
**這樣一來,大數據的性質就變了,從自然科學侵入到人文社會研究,從科學蜕變為“唯科學主義”。**這就不僅僅是一個研究工具的問題,而是一個認識論的根本問題。對此進行批評的人文社科著作汗牛充棟,本文不再一一列舉,僅在操作的層次上分析一下,人類無限豐富的生活實踐,在被“唯科學主義”改造成“數據”的過程中,究竟發生了什麼。
**▍**現實生活被裁剪
大數據崇拜者極力鼓吹“4V”(規模大、種類多、高速度、高價值),卻故意迴避了一個根本的問題:在最開始,您收集到的,就是可以用來分析的數據嗎?
在社會學的問卷調查中,這是有可能做到的;但是在所謂的大數據中,卻絕對不可能。因為大數據並不是研究者主動去收集的人類行為及其結果,而是五花八門的所謂“客觀記錄”,是人類生活中微乎其微的那一部分“可獲得信息”,例如上網活動所留下的痕跡、監控記錄等。
可是盡人皆知,在人類活動的全部信息中,可獲得的要遠遠少於不可獲得的。後者最典型的就是人類的一切精神活動的信息,在可預見的未來,仍然不但是無法獲得的,而且根本就是無法監測的。這樣一來,所謂大數據所獲得的信息,首先是極端片面;其次是漫無邊際;第三是支離破碎;第四是毫無意義;根本不可能直接用於任何量化的分析。
那麼,這樣的信息怎麼才能轉化為可分析的數據呢?首先是必須加以“界定”,就是保留什麼和捨棄什麼;其次是進行“分類”,就是把什麼歸屬於什麼;第三步是加以“定義”,就是給某類信息賦予特定的人類意義;最後一步則是“賦值”,就是把不同的定義轉換為可計算的數值。
以上網活動的痕跡為例,大數據的生產者,怎麼來界定那些痕跡是有意的還是無意的、閒置的還是凝視的、主動尋找的還是被引導而來的?界定之後,到底是根據停留時間長短還是活動的頻率,來製造出“活躍”或者“不活躍”
**這樣的類別呢?為什麼把“活躍”就給定義為“需求”呢?最後,把“需求”賦值成什麼?**從“不需求”到“強需求”的不同賦值之間,究竟是什麼樣的數量關係呢?
顯而易見,在這個四部曲的過程中,完完全全是研究者自己在主觀地、人為地、強制地“整理”那些“可獲得信息”,把人類生活的痕跡,完完全全地篡改為自己的世界觀和價值觀所能接受的“數據”。往好裏説,這叫做無可避免地加工;往壞裏説,這就是赤裸裸地偽造。
**這就是説,所謂的大數據,其實一點都沒有超出“小數據”原有的侷限性:裁剪生活,撕碎人生;非要把整體生存的“人”,視為一堆雜亂的零碎。**在實際生活中,人類絕對不是,也不可能是這樣來“量化地”認知和行動的。因此,大數據其實並不是幫助人類思考,而是企圖取代和控制人類的生活經驗,是人工智能的噩兆。
**▍**社會情境被忽視
**有人已經發現,大數據記錄的都是單獨個人的行為,無法發現不同行為者之間的關係;**於是問題就來了:在這個現實世界裏,難道真的存在一種與他人毫無關係的個人行為嗎?難道個人的一切行為,不都是在一定的人際關係中,才會產生,才會帶來某種結果嗎?
社會不是個人的簡單集合,而是人們通過各種關係有機地組織起來的。同時,人們又是在特定的社會環境中做出各種行為的,不可能天馬行空,獨往獨來。因此,人類活動留下的一切痕跡,必定藴含着無限豐富的社會內容。如果捨棄之,那麼不管什麼樣的數據,不僅是浮光掠影,而且必定是盲人摸象。
尤其是,每一個人都在特定的社會中,一點一點地成長為“此時此景中的此人”,然後才會做出“此因此果的此行為”。這就是每個人的社會歷史建構過程,其中最重要的就是我們的一切社會背景、生活狀況和成長經歷。
可是這一切,往往僅僅存在於我們自己的經驗與記憶之中;往往難於言表,更往往無法記錄。從“客觀監測”的角度來説,根本就是“風過無痕”。那麼,就算毫無隱私,就算監測可以天羅地網,所謂大數據的信息源又是從何而來的呢?因此,對於瞭解人類生活而言,大數據其實根本就是空中樓閣。
如上所述,這樣的批評還是很中肯的:“數據不懂社交、不懂背景,會製造出更多噪音,遺漏真正有價值的東西。大數據無法解決大問題。”
**▍**主體建構被抹煞
**“大數據崇拜者”很可能不知道,或者不敢承認:在人類生活中還有一種現象,叫做“主體建構”。即人們對於自己的行為所做出的解釋,很可能與監測者的解釋大相徑庭,甚至背道而馳。**最常見的就是,一切人際的誤會,蓋源於此。
那麼,無論大數據監測到多少人類的行為,它究竟是如何分辨出其中主體建構的成分呢?首先,以網購的大數據為例,即使您收集到全部的上網痕跡,而且全都數字化地一覽無餘,那您怎麼知道人家就真的就是這樣想的呢?這種“客觀測定”,離礦物學很近,可是人卻是有主觀意志的啊,您是怎麼監測到的?連物理學還有個“測不準原理”呢,何況對於人的主觀意願?其次,您知道人類還會“自我呈現”嗎?説不好聽一些,就是表演。如果連測謊儀的結果,法律都還不予採信,那麼您怎麼篩除被監測對象的表演呢?第三,難道您就不找被監測對象去核實一下?在司法審判中,就連證據確鑿的罪犯,法官也必須聽取他的説法,才能做出正確的判斷。可是大數據崇拜者卻根本漠視主體意願的存在。這豈不是自欺欺人?第四,您聽説過弗洛伊德嗎?您知道除了“動機”,還有“無意識”嗎?
即使是某些詢問對方意願而獲得的數據,也仍然存在着這樣一個問題:對方是否具有足夠的能力來表述自己的意願呢?我們不應該忘記弗洛伊德,不應該忽視無意識行為的廣泛存在,更不應該否認:人類的一切行為痕跡,無論多麼海量,其實並不能容納和表述人類的生活意義。因此,如果行為者自己都搞不清楚自己是怎麼回事,那麼您還怎麼去核實呢?根據什麼來判斷真偽與程度呢?
總而言之,一切試圖用自然科學或者數字化來了解人類及其社會的嘗試,不是都必然失敗,而是都無法否定人類“主體建構”的重要性,結果都必然是把真實的生活給削足適履了。
因此,大數據所獲得的一切“發現”,其實只不過是某些人在描述其他人的生活。**其他人既不知道自己已經被描述了,也沒有渠道去修正這種描繪。結果,大數據其實只不過是一幫技術分子所構建起來的新的認知霸權,**其崇拜者也只不過是急於使用這個霸權而已。
**▍**生活意義被取消
人文社會研究的至少兩千年曆史告訴我們:人類的一切行為,不僅藴含着他們的人生意義,而且是為了追求其人生意義而行動的。這是人與物的根本區別。
可是,大數據所謂的一切“可記錄的痕跡”,如果沒有獲得對方的主訴,那麼就不可能包含該行為意義的信息。例如一切上網活動,行為主體都不會表述自己為了尋求什麼才這樣做的,也不可能表達出這樣做帶來了什麼樣的價值與意義。
以購物網站記錄下來的數據為例,它確實可以容納數千萬人在購物時不知不覺地留下的近乎無窮無盡的痕跡;但是,這就能反映出這些人的購物偏愛嗎?難道這些人就再也不在實體商店中買東西了嗎?難道他們在一時一事上表現出來的偏愛就永恆不變嗎?難道他們的每一次上網購物都能得到自我滿足嗎?
那麼,您怎麼能夠確定:他們在不同的渠道中,在不同的情境之中,都會做出一模一樣的選擇呢?如果您無法證明這一點,那麼您的“大數據”就只能是“大垃圾”,一點兒也不冤。
交通監控錄像、醫療記錄、通訊記錄等等,都足以號稱自己是“大數據”。可是,所有這些數據,都僅僅是記錄下了人們生活中的一個個零散的側面。因此,這樣的“大數據”再怎麼大,也無法解決以下一系列常識性的問題:首先,人在生活的某個側面裏的表現,與他/她的整個人格與人生,難道不存在緊密的關聯嗎?農民工吃20元的盒飯都嫌貴;富豪買上千萬的汽車也不眨眼,這難道僅僅是所謂的“消費選擇”嗎?其次,人類生活的各個側面之間,難道不是相互影響着的嗎?農民工吃20元的盒飯,卻可以搭上200元的禮錢;富豪買上千萬的汽車,卻不肯做一點兒慈善,這也僅僅是所謂“購買習慣”嗎?第三,任何一個人的生活,難道不是被社會、文化、歷史等因素制約着嗎?農民工之所以要吃20元盒飯,絕不僅僅是因為工資低,還因為他的撫養係數、失業可能性、職業風險等等都比富豪要高出很多。這,難道也是“可支配資金”嗎?
如此這般,數據越大,豈不是錯誤越大?
**▍**結語:原罪就是原罪
本文所論述的一切,其實都是來自人文社會研究中,久已存在的對於“量化研究”的批評。大數據崇拜只不過是這種思潮的最新表現,只不過是披上了更為光鮮亮麗的外衣而已。
在基督教教義中,原罪不但是與生俱來的,而且是揹負終身的,不能通過人自己的救贖而被消除。
**很可惜,量化研究也是如此。無論其技術手段如何發達,無論其數據多麼大,一旦應用於人文社會研究,其缺陷與弊病就根本無法避免,充其量也不過是程度的減輕而已。**説到底,“大數據崇拜”,其實就是“唯科學主義”在人類歷史面前一敗塗地後的末日哀鳴。如果科學沒能阻止希特勒的統治,也沒能預測出此後人類的一切發展,那麼就絕不是“藝不精”的問題,而是用錯了地方,是越界跑到了自己無能為力的領域。
當然,這並不是説,量化研究和大數據就一定不能用,而是表達三層意思:首先,它們都不能質疑更不能取代各種非量化的人文社會研究;其次,只有對這些先天缺陷進行深刻反思,並且予以充分展示的量化研究,才有資格在人文社會研究中保留一席之地;第三,兩種研究就像是兩條鐵軌,缺一不可,但又平行延伸,永不交叉。