開除人籍!_風聞
非凡油条-非凡油条官方账号-深度解读全球政治财经动向的前因后果2020-10-30 18:38
算法是個奇異果
美國大選已經進入膠着狀態,各家機構已經開始摩拳擦掌,誰能預測對誰就是新一代的國師,我們在這裏談到了預測,説明我們用的是數學思維,誰能摸準最準確的選民心思,誰就能贏。
但人類的行為不能被統計學模擬,至少是無法被精準擬合,要不然四年前該當選的就是希拉里了,地堡男孩也就無法給我們提供這四年的快樂。
現在美國大選民調回復率一直在走低,2015年只有7%,1997年還有36%,我感覺是説自己支持特朗普不太好意思,所以乾脆不表態,調查的樣本都有問題那這結果還能準確嗎?
這可不是我瞎説,蓋洛普10月1號的數據顯示,56%的美國人認為現在的生活比四年前好,即使是800萬+的感染率,20萬+的死亡率。
**☉**中國人民真爭氣,美國人民真頭鐵
遇上這情況,大活人都弄不懂美國人現在啥情況,就難為統計學了,説到底,還是人類過於奇異,不像三體人那麼老實。
“我們撒謊,我們欺騙”,有樣學樣,美國大選預測徹底成了因信稱義的玄學問題,計算機表示屬實無能為力。
政治如此,商家只會更肆無忌憚運用數學工具,美其名曰數字營銷。
好傢伙,我直接好傢伙,雙重壓制下,我們徹底變成了單向透明,商家可以為所欲為,最近甚至在某些網絡交易平台上,1000張人臉照片賣2元,可管理部門姍姍來遲。
淘寶差評都變成了體驗不佳,就像雪中悍刀行的全員主演,沒有人説不好。那就是都好。
怪完了政治怪商家,這不是説技術就是無辜的。
技術作為人造物,無論有形硬件還是無形軟件,都會帶有人類的特性。
其實大家考慮一下,統計學本身就自帶偏差,比如很簡單的眾數和平均數概念,應用到人類社會那就是對少數羣體的合理歧視,你跟馬雲平均一下你也是人均300億美元的男人。
所以大家都要求統計局公佈中位數,那問題來了,那最底層的人均能被中位數表現出來嗎?
這些數字看起來都是價值中立的,但是人類社會誰能沒有立場,當我們大踏步進入計算機世界,發展出AI技術,言必稱算法強大,算法本質上由數據驅動,數據反映的是人間真實,人解決不了的問題,別指望計算機去解決。
2018年,就有旅遊App進行歧視性定價,一位羅先生拿自己手機一查房間價格是380,朋友手機300,這80塊錢就被算法誤判了,誤判是某旅遊App自己説的。
人間保安臨時派遣工,計算機算法有誤差,懂得都懂,看來臨時工才是人類進步的阻礙。
美國離我們有點遙遠,可是算法歧視每天浸潤在我們的生活中,給大家簡單盤一盤算法是怎麼歧視我們的。
魯迅先生説做奴隸而不自知是最可悲的,我們努力讓自己的生活不那麼可悲。
算法歧視包羅萬象
20世紀三大矛盾:性別、種族和階級,具體到我們的生活,我們沒有階級矛盾,人民富豪也是人民的一份子,只有消費者和商家的糾紛。
消費者行為是近年來的集中暴雷區,iOS多個版本現身説法,蘋果上買點東西總是比安卓機貴點。
商家説是蘋果税,蘋果説跟我沒關係是商家亂定價,誰對誰錯難分,但操作很簡單,只要App開發者標識探測到你的機型就可以改改價格標籤,這在算法操作上難度不超過1+1=2的級別。
更別説還有老客户不如狗,聯通京東老用户可以現身説法,更別説還有新用户專區和首單包郵,這裏面的邏輯在於綁定用户以獲取數據,你認為1元包郵很便宜,商家看來1元買來算法的優化類似於白撿。
她不知道現在所擁有一切,早已在命運中標好了價格
——茨威格
種族問題更是跟我們沒關係,這是美國人的專屬 ,暫時還是留給他們去煩惱吧,我們不被歧視就不錯了。
那剩下的就是性別了,也是唯一可以被討論的矛盾議題,分佈範圍也廣泛,像什麼消費者行為、P2P裸貸,甚至是學術界,道貌岸然的學術界歷來是男性的天下。
“女孩不適合學數學”是我們從小聽到大的嘮叨,長大了可不就都去學文科了。
2014年伊朗裔美國人米爾札哈尼獲得菲爾茲獎,研究領域是幾何學和動力系統,這是什麼東東我不知道,但世界都知道她是女性。
**☉**米爾札哈尼(1977~2017),首位女性菲爾茲獎獲得者
2020年自然子刊神經科學一篇論文顯示,女性研究者被引數量遠低於男性,還有發文數量,2017年,美國就有研究顯示在STEM領域中,女性的同行審議只佔20%。
不過情況確實在好轉,2018年神經科學研究中女性發文數量已經佔比50%,希望在前方。
學術界受害者最主要是女性,但現實裏階級被模糊化為消費能力,反而是在歧視窮人,還可以疊個buff,如果你不幸是小鎮出來到上海打工的江西男青年,恭喜你,基本上在網絡中被歧視的最底層。
唯一能共情的,也只有河南老鄉可以感受到這種痛苦的了。
城市裏還有女性發聲,小資們有錢有閒可以為自己吶喊,打個很簡單的比方,微博需要流量,這些話題討論的越熱烈微博流量越高,算法在推薦機制上會給她們更高的權重。
**☉**可預測就意味着知道哪些是流量爆點
假名媛也是要有一定消費能力才能扮演的,鄉村小妹輟學後只能去富士康,拼單也消費不起下午茶。
最慘的是農村婦女,那位要找靳東的老年婦女,雖然主流輿論是羣嘲,但準確來説是算法精準定位用户人羣,而且你也看到了效果簡直拔羣,如果運用到保健品領域呢?
面對算法,誰也不能免俗,看看雙十一的紅包機制就一目瞭然,年輕人有年輕版的智商税。
計算機為啥看不起人
算法歧視的社會學本質是“污名化”,也就是對特定人羣的非人化表述,俗稱開除人籍,把你當做純粹的商品來看待。按照馬克思的觀點就是分化羣眾讓他們無法團結,具體操作上是把歧視分層,總有最頂層和最底層,你不滿就向上爬,而不考慮爬不爬得上去。
算法歧視首先是人的問題,人在設計模型的時候帶有意識形態,比如有監督模型中的人工特徵選取,可以加高某些權重,比如以前谷歌搜索idiot會出現特朗普的照片,大總統還特地發推抗議。
**☉**領會一下就好,真放idiot號就沒了
其次是數據採集的問題,即原始數據集存在問題,上過初中數學大家就明白,錯誤可以避免,誤差只能縮小,人類社會都做不到全然公正,何必難為數據集呢?
初始訓練的數據集都會存有問題,所有要不斷調優,但是應用到工程中問題就變成了胎裏帶,再優化也解決不了。以往商業銀行風控模型,明顯偏重大企業和機關事業單位,馬雲的普惠金融為什麼敢給個人放款,不是因為善良,而是你用淘寶和天貓、支付寶,你有幾斤幾兩他很清楚。
此外還有一個隱藏的問題,那就是相關≠因果,算法模型吞吐數據本質上是相關性的建模和計算,但是因果律是時序和邏輯鏈傳導,這也是計算機難以模擬人類思維的核心問題所在,也就是説計算機的或與非邏輯多大程度上符合人類真實思維,這是個數學問題,但也是個腦科學和哲學問題。
我們的意識真的能夠思考構成我們的物質嗎?還是隻能縮小誤差而不可能把置信度做到100%,人類吵了兩千年都沒解決的問題,真的別難為計算機。
最後就是資本主義的痼疾——為利潤而生,為利潤而死。只要有300%的利潤預期,就敢去挑戰監管給自己買條絞繩。
市場競爭,自然就是各個市場領域條塊分割,主要分割我們的的時間片段,出門有交警攝像頭,打車有地圖記錄行蹤,刷短視頻有快手,購物有京東。
你的本來樣貌都被扭曲了,各家公司都按照你的片段去推斷你是什麼樣的人,所以怎麼解決?我有一計,全都交給政府,做一個統一的數據平台,讓個人信息成為公共資產,讓各大公司把算法開源,一起探索數字共產主義實現的可能性。
這病其實不好治
現實裏的傳染病,中國治得了,老百姓統一調配聽指揮,一個健康碼就已經讓全國信息一盤局了,泡泡算法更是簡單。
西方為啥管不了,因為20世紀80年代以來,新自由主義思潮影響下大幅度弱化政府監管,結果就是個人不聽話,政府沒效率,最後就是一起上天堂。
現在歐洲要反谷歌壟斷,美國要計劃拆分Chrome,甚至立法禁止谷歌搜索的壟斷,嚇得蘋果都要自研搜索技術了,好像惡都是谷歌做的,稜鏡門才過去幾年吶?忘了,莫斯科裏的斯諾登還看着你們表演呢!
“黑命貴”之火燒起來的時候,多個AI大牛被惹火燒身,包括獲得過圖靈計算機科學獎的Hinton都被批判設計的算法歧視黑人。這股風蔓延到學術界,很多人要求改變算法模型對黑人的歧視,因為相關性的存在,黑人在暴力犯罪和銀行貸款上受到普遍歧視,甚至有位女黑人計算機學家要求白人男性科學家多引用她的論文,否則就是歧視。

**☉**谷歌,Don’t be evil
AI算法框架中TensorFlow是谷歌的,PyTorch是Facebook的,從過往風評看,他們設計的算法有其實也實屬正常。
瓜田李下,有理也説不清楚。
可能還是看中國,治病救人懲前毖後我黨是專業的。現實裏的病治得了,虛擬世界的病也差不多,算法的問題,看似是虛擬世界的價值中立的技術問題,但究其本質是人類世界傳染到計算機的問題,這樣一想難道人類才是病毒源頭?
個人信息保護法是個起點,但是算法、數據、監管、個人保護意識缺一不可,2019年針對就業歧視規定罰款上限是5萬,真的是很有特色了。
所以這次你看好嗎?歡迎和我們討論一下,萬一新的算法模型設計思想能擺脱歧視呢~
參考文獻:
陳力簡:看完荒唐的主流民調,我押1000美元賭特朗普連任https://www.guancha.cn/Chenlijian/2020_10_28_569475_s.shtml
數據告訴你,論文引文裏有多少性別偏見http://www.zhishifenzi.com/depth/depth/10241.html
微博機制和轉發預測研究https://www.researchgate.net/profile/Li_Weigang/publication/272621063_Research_on_the_Micro-blog_Mechanism_and_Re-posting_Prediction/links/551013ce0cf224726ac4fe75/Research-on-the-Micro-blog-Mechanism-and-Re-posting-Prediction.pdf
楊成越, 羅先覺. 算法歧視的綜合治理初探[J]. 科學與社會, 2018, 8(4): 1-12, 64.
本回完