《流浪地球》元評論:一場史無前例的神經網絡訓練_風聞
气体君_vermissen-线上不规范,运维两行泪2019-02-18 00:14
昨天三刷了 IMAX 小破球。入場前陸家嘴黃昏的天際線,散場後東方明珠瑰麗的夜景;遊人們永是三三兩兩地拍着照片,很能夠將人從電影場景拉回現實世界。
從年前先行觀影會一眾大佬的推薦到現在,也過了不短的一段時間。互聯網世界節奏如此之快,一些常用於引導輿論的 app 早已換了一波熱點。但就在這樣的消費主義健忘空氣中,我們的#小破球#話題卻猶如那木星的大紅斑,持久的氣旋,仍然在攪動着輿論大氣層;就在這兩天,甚至還“喜提鐘聲成就獎”、“喜提鈞正平”,累計票房衝上華語電影歷史第二位,簡直是給一些 PTSD 患者實行飽和式刺激療法!
當然,這些人也沒有閒着;某系媒體據傳謀劃“黑掉”小破球、大劉形象(“人設”),吳京酒後挪車的新聞被翻出來炒,某教授觀影后提出 69 個質疑隨後即被附上“編者按”傳播,“批評不自由則讚美無意義”……
--
鄙人上次從自己三腳貓的投資知識視角出發,寫了一篇為何資本們不會因為一部電影成功就更多投資良心電影的文章。當然後來也有一些別的“更專業”公號來寫了,雖然鄙人並不知道他們實際上比我有多專業,但看上去很厲害的樣子,就不跟他們蹭熱鬧了。
這次來寫一寫鄙人稍微更熟悉一些的話題——機器學習吧!(下稱“煉丹”,反正差不多一個意思)
--
關注煉丹界花邊新聞的讀者應該都知道一個喜聞樂見的項目 DeepFakes……不過不知道也不要緊(你可以看完、噴完之後再搜),類似原理的項目還有很多。前幾天剛出的 StyleGAN(生成人臉)、前一陣子還有風聞寫過的 style2paints(線稿上色),等等。如果把視野放寬,甚至 Alpha 系列(AlphaGo、AlphaGo Zero、AlphaStar),也具有類似的特點。
這些項目的共同特點是訓練方法基於對抗。
DeepFakes、StyleGAN、style2paints 這些都是典型的 GAN 結構。GAN 全稱 Generative Adversarial Network(生成性對抗網絡),其基本套路是兩個網絡間進行零和博弈。具體來講,一個網絡負責鑑別(evaluate、discriminate)輸入的“真偽”;一個網絡負責生成特定的輸入以擊敗前一網絡,也就是讓前一網絡的準確率最低為訓練目標。兩個網絡協同訓練、一起進化——顯然生成網絡的輸出全是假的,這部分數據當然就是鑑別網絡的訓練集。具體的訓練方法因為鄙人自己也沒玩過。。所以感興趣的同學可以參考維基百科,以及上述項目的代碼自行折騰。
Alpha 系列 AI 的結構並不是 GAN,但它們的訓練過程仍然基於對抗。這些網絡本身都是智能體,生存環境是某種遊戲的狀態空間,主觀能動性表現為能夠執行遊戲操作;訓練過程的架子基本上是一種“天梯”競技場,以活得最久、拿最高分為目標,是一種強化學習(reinforcement learning,RL)。
人類社會中,也存在類似的數學構造。
俗話講“道高一尺,魔高一丈”,這句話能貼切形容的行業,各位看官仔細想想,還不少!
互聯網行業喜聞樂見的爬蟲/反爬,社會治安中的詐騙/反詐騙、偵查/反偵查,軍事中的隱身/反隱、制導/攔截……
當然也有這次要講的,輿論上的“粉黑”互撕現象。
前面講,AlphaGo 這種神經網絡,本質上已經屬於智能體;因為它們有輸入輸出,能感知環境,能發揮主觀能動性。實際上,我們人類本身,按照當代神經生理學的理解,本質上也沒有太大不同——感覺神經元收集信息,傳入中樞神經系統,經過信息處理後,轉化或者不轉化為運動神經元的興奮,體現為影響或者不影響周圍環境。
儘管人類至今未能破解大腦的全部工作原理,但按照目前的理解,人腦也是一種神經網絡,只不過:
- 神經元數量極其龐大,其中又分出很多規模較小的子網絡,執行較為特化的功能;- 神經通路有塑性(plasticity),高頻“調用”通路的延遲、信噪比可以自動優化(貌似是加髓鞘,相當於導線包一層絕緣皮),還可以重新編程;- 信息在神經元間的傳遞並非像人工神經網絡一樣高度簡化(加法),而是基於脈衝的複雜變化;- 一些神經元本身有狀態(“記憶”),按照很久以前看過的一篇忘記了名字的文獻,它們會自己合成一些新的蛋白質,或者基因片段,具體是為了幹嘛好像還不清楚。
簡而言之,人類大腦是一個充滿“未來感”“黑科技”的神經網絡黑盒模型。但很大程度上,它的工作原理,甚至面對訓練集的反應,其實與人工神經網絡也有幾分相似。人腦能提取的特徵,卷積層也能提取;一種網絡結構總有些困難樣本,人腦也有,等等。
站在這樣的視角,再來看人類社會,你對一些社會現象的看法會不一樣。
--
你終將意識到,
那從散場的影院走出,醖釀着影評的每一個個體;
還堅守在崗位前,履行着職責的每一個個體;
窮困潦倒的,聲名顯赫的,失落彷徨的,躊躇滿志的,
卻都是平凡的個體,都説着類似的語言,有着類似的文化,
輸入、輸出的類型是兼容的。
這每一個智能體組合起來,成為強大的神經網絡 ensemble,
來面對下一個未知的輸入,做下一個選擇。
在這場史無前例訓練的另一側,同樣也有着
窮困潦倒的,聲名顯赫的,失落彷徨的,躊躇滿志的,
也都是平凡的個體,也説着類似的語言,有着類似的文化,
輸入、輸出的類型是兼容的。
這每一個智能體組合起來,卻多了資本的加持、神的授意,
也成為不可一世的神經網絡 ensemble,
要讓天下皈依這天選的安排
——命運天註定。
——龍生龍,鳳生鳳,老鼠孩子會打洞。
——人人生而平等,但有些人更平等。
——國際貿易中,每個國家應該發揮比較優勢,擅長什麼,就提供什麼服務。
——你今生受的苦,來世終會得報。
……
氫氣與氧氣正如往常一樣混合,直到《流浪地球》這根火柴點亮。
大氣爆燃了,訓練開始了!
短短的一兩週,話題下的語料倍速增長。
正方、反方;反裝忠,手動狗頭。
政治、法律;天文、地理;投資、管理;討論,元討論。
語料的流動是如此迷人,甚至來不及寫一個爬蟲蒐集,因為怕編程擠佔了人腦的閲讀理解——享受時間!
由於雙方個體的分野早已存在,兩組 ensemble 迅速自組織起來,形成了陽春白雪-下里巴人的分論壇(戰場),意見領袖-吃瓜羣眾的 ensemble 層次結構,建構了各自的話語體系,並試圖解構對方。
雙方的注意力向量有如戰火,從影片本身的人設、劇情、特效延燒開去,迅速回歸了社會治理、政治經濟、意識形態的主戰場。這何等熟悉、何等親切的戰場啊!
這次的 GAN 戰役,反向傳播的權值更新之快之劇烈,網絡結構的自我調整之靈光乍現,都是這一代年輕的個體所未曾見。
我們在目睹的,無疑是一場史無前例的對抗式神經網絡集羣訓練。
這是千千萬萬人類至今無力描述的高階神經網絡,
組成了人類至今無力描述的恢宏集羣,
用人類至今無力描述的高階訓練算法,
打響的磅礴訓練過程;
而這樣的磅礴,
只不過是人類進化過程中
從未停止的競爭、廝殺的又一秒鐘而已。
--
呼吸着陸家嘴帶着些微寒意的空氣,面對着繁華的夜景、安寧的人們。
這時代是科幻的時代,我們就生活在這科幻的時代。
胸膛湧現一股暖流,我知道這是名為多巴胺的感動,是大腦的強化學習算法告訴自己——
這事做對了;無論是受到了激勵,獲得了工作激情這一點,
還是獲得了嶄新的切入視角,可以發貼走一波閲讀量這一點。
找不到好的配圖,就不放了,雖然會影響閲讀量,不過算了。。。