美可以度量嗎?一種用複雜度指標刻畫藝術品美感的嘗試_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2019-11-30 10:35
**撰文 |**十三維
**審校 |**劉培源
**編輯 |**張爽
來源:集智俱樂部
為什麼有些繪畫作品結構不那麼複雜,卻給人身臨其境的美感?什麼樣的信息組合方式會讓人覺得美?我們是否有可能度量藝術作品的美?在近期的一篇 arxiv 文章中,作者從熵複雜度的三種度量出發,重新審視了圖像欣賞與其統計屬性之間的關係。通過生成符合標準的兩組不同隨機圖像集,對不同人羣進行了一項大規模偏好調查,最終揭示出具有中等熵複雜度的圖像具有最大欣賞價值;並指出在對圖像進行粗粒化處理後,從高頻噪聲中提取的結構複雜度大小,可以作為預測人們審美偏好的良好指標。
存在普遍的美嗎?
是什麼造就了美的形象?世界上存在普遍的美嗎?
這些令人困惑但又迷人的問題,過去似乎已在包括哲學、心理學、藝術或數學在內的諸多領域中被解決過很多次 。
早自古希臘開始,人們就嘗試理解美的普遍性。他們認為大自然本身就是和諧與秩序構成的宇宙:無論是藝術品、生命體甚至城市,都由每個構成要素之間的恰當比例所定義。
在希臘人之後,巴洛克和文藝復興時期的藝術家們也相信普遍之美,而且令人驚訝的是,他們的藝術部分依賴於表現形式的數學化特徵,例如對稱性、黃金分割比等。此後我們還可以看到遞歸與分形等複雜結構特徵。文藝復興三傑之一的達·芬奇,就不僅是一名偉大的藝術家,同時是一名堪稱全才式的科學家與數學家。
圖1. 達芬奇的維特魯威人
因此,歷史上關於“什麼是藝術或美”,必須要有科學標準的信念,其實已經存在了相當一段時間。儘管這種普遍美的觀念在藝術史上斷斷續續被忽略和爭論着,甚至如今被很多後現代思想家強烈反對着。
那麼我們不禁想知道,所謂“美可以被度量”這種觀點,究竟是否只是一種語義矛盾的修辭?以此基礎建立一種一致性標準的繪畫藝術理論是否真的可能?
拋開藝術史上的觀念之爭,也許從物理學與複雜性視角能給我們一個恰當的答案。
信息熵的三種複雜度
最近以法國物理學家 Samy Lakhal 為首的一個科學小組,對這個問題進行了研究。他們在預印本網站arxiv發佈了一篇題為《Beauty and structural complexity》的論文,探討了美與複雜度之間的關係。
論文題目:Beauty and structural complexity
論文地址:https://arxiv.org/abs/1910.06088
不僅學習效率在“熟悉”與“意外”(秩序與複雜、無趣與驚喜)之間存在最優的配比,審美感受可能同樣如此。心理學家 Rolf Reber 曾提出過審美愉悦加工的流暢度理論**[1****]** ,數學家 George David Birkhoff 甚至提出過審美公式 M = O/C(其中 O 為秩序,C 為複雜度)[2****]。只不過,目前對複雜度 C 的度量並沒有統一標準。
而本篇論文研究,則可以説從物理信息角度從對此推進了一步。
研究者結合了物理學家 Greg J Stephens [3**]的自然圖像熱力學理論**(Thermodynamics of Natural Images),認為可以通過尋找某個熵態函數(entropy-like function)來量化這種在無趣與驚喜之間微妙而複雜的美感平衡。
目前存在許多圖像複雜度的度量方法,例如根據其數學屬性、物理屬性或者圖像的認知屬性。在論文中,研究者選擇了對於任何數字二維圖像都可以很容易計算出來三個簡單指標。
第一種是根據 幅值斜率 α (magnitude slope α),定義為徑向平均傅里葉振幅的對數斜率,它在對圖像取灰度後進行傅里葉變換取得。
圖2. 三張進行了傅里葉變換的圖像及頻譜,第一行和第三行的 α 值比較高,但也充滿噪音
第二種是計算圖像的分形維度 df(fractal dimension),論文使用閔可夫斯基計盒維數法(Minkowski-Bouligand box-counting)進行計算。將圖像放在一個均勻分割的網格上,數一數最小需要幾個格子來覆蓋這個圖形的邊長。通過對網格的逐步細化(取無窮小),計算覆蓋盒子數目對數與整個圖形格子數比值的極限。
圖3. 英國海岸線的盒維度估計,約為 1.26
第三種為圖像的壓縮率或算法複雜度τ(algorithmic complexity),通過計算壓縮圖像對未壓縮圖像大小之比獲得。這種方法的思路是:如果一幅圖片表達的信息很少,那麼它就可以被壓縮算法壓縮得很小,因此壓縮前後圖片的比值就可以代表一幅圖片的複雜程度。
概念:什麼是複雜性?
複雜性(Complexity) 本身就是一個“複雜”的概念。在複雜性科學中,有“要想理解複雜,先要理解複雜”的説法。不過,我們依然可以從有序的角度來認識它,可以理解為:複雜是一種處於完全有序和完全無序之間的狀態——於是有趣的事情發生了,這非常類似 George David Birkhoff 對審美度量的定義,這似乎暗示着,美與複雜度本身就是互為隱喻的。
圖4. 處於完全有序和完全無序之間狀態的複雜
只不過,因為複雜本身就是一個複雜的概念,因此對複雜度的定義和度量有太多爭議。數學家 Horgan 曾統計過**[4****],複雜性的定義至少有 45 種,目前則不下 50 種。不過,總體可以分為客觀複雜度和認知複雜度大類,前者是物理或本體意義的複雜,例如熵複雜度,無法通過認知進行化簡,後者指隨着人類認知提升、掌握規律後就能變得簡單的複雜。在此基礎上,複雜度則可以劃分為信息類、熵類、描述長度類、深度類、複雜性類、多樣性類、維數類、綜合類(隱喻)等幾大類[5****]**。
統計特性與圖像欣賞
為了研究清楚這個問題,研究者進行了一項大規模的調查。要求人們根據喜好對兩組不同的隨機圖像進行排序。為了消除可能的認知和文化偏見,研究者設計實驗時選擇前兩種複雜性指標隨機生成了以下兩組更加抽象的圖像(圖5)。這兩個序列的圖像複雜度從左到右依次增加。
圖5. 分別使用傅里葉幅值逆變換和計盒維數法生成的兩組圖像
第一組圖像通過對傅里葉幅值的逆向變換生成。在256×256圖像陣列中生成了六幅灰度圖像,並計算了振幅斜率α、分形維度df 和算法複雜度τ。在彙集計算結果的表 1 中可以看到,df 和τ都是α的遞增函數,這支持了研究所選複雜度指標的有效性,顯示在圖像頻譜,分形維度和算法屬性之間存在明顯的相關性。
第二組的圖像,在詢問了受試者的視覺喜好,即更偏愛多雲的天氣或銀河的景觀後,由研究者們逆向使用了閔可夫斯基計盒維數法進行生成。這種方法能有效產生更多抽象圖像。算法在256×256圖像陣列中隨機添加“盒子”,約束最大的正方形不超過總表面的1/16,黑色面積總和不超過1/2 。結果表明,這幾種複雜性度量之間同樣在彼此增強(表1)。
表1:
那麼,生成的圖像的統計特性和人們欣賞它們的傾向之間有聯繫嗎?為此研究者們對不同參與者進行了三項略有不同實驗調查。
第一次調查參與者來自CFM 理工學院和巴黎理工學院的同事以及學生,總共約有350人蔘加,均無私自願參與,沒有任何經濟激勵。研究者使用了 Zooniverse platform 平台。在一個直觀的界面上,要求受試者對隨機生成具有不同複雜度的圖像喜好程度進行打分。為了方便排名,分值經過類似歸一化處理,統一在[0,1]區間,結果在圖6a中用實心黑線展示。
研究者們發現,參與者首選的圖像分別為a4、a5與b4、b5,它們均對應於接近1的斜率α。而α≈1 斜率正是自然圖像和視覺藝術的所對應的光譜特性。與參與者的討論也表明,他們認為自己喜歡的圖像最和諧,最均衡。
圖6. 受試者對隨機生成具有不同複雜度的圖像喜好程度進行打分。為了方便排名,分值經過類似歸一化處理,統一在[0,1]區間,結果在圖6a 中用實心黑線展示。在圖6b中第一次結果用灰色表示,第二次實心黑線。
為了增加研究的規模和參與者的多樣性,另外兩項調查在 Mechanical Turk 平台上進行,有一定報償支出。第一次結果在圖6b中用灰色表示,第二次實心黑線。第一次略微嘈雜的結果,研究者認為是部分受試者為報償不認真的緣故。在第二次對回報進行限定後(若故意偏離將不獲得報償),其結果表明噪音顯著減少,與最初的無私調查組具有更好的一致性。
兩項調查均得出結論,圖像的統計特性,即中等熵複雜度與人們之間的欣賞偏好是彼此一致的。
從熵複雜度到結構複雜度
此前,俄勒岡大學的物理學 Richard Taylor 和合作者曾對視覺分形圖案的研究發現,圖像欣賞與分形維數之間呈倒U型關係**[9****]**,其美學最佳值為中等分形維度(論文引述為df≈1.5,但根據在 2016 年出版的《The Fractal Geometry of the Brain》,應為 1.3~1.5),這與論文研究的結論相符,説明人們確實偏愛於中等複雜程度的圖像。
但是與本文的圖像用例相比,複雜度數值卻更為偏小。
熵畢竟是被用來測量物理系統中的無序度,對於人類知覺審美來説是否有不同之處?
在非常簡單的形狀 (a1、b1),以及具有非常高複雜性、顯示大量白噪聲 (a6、b6) 的圖像之間,是否存在一個更準確的指標,能表達人類美感在複雜性和規律性之間微妙平衡?
法國國家科學研究中心的數學家 Desolneux 等人的工作給研究者提供了啓發**[6****]:在人類的格式塔感知**過程中,白噪聲是沒有可感知的結構的,這些噪聲會被排除在知覺的空間排列中。
例如,在咖啡與牛奶混合的動力過程中,雖然最終會進入某種同質均勻的混合狀態,在物理熵(複雜度)上達到最大,但對人來説,在奶油/咖啡界面慢慢消失時的過渡狀態卻是更加複雜而有趣的過程。
也就是説,物理熵複雜度最大,並不代表人類知覺複雜度最大,是人類知覺到的複雜度影響了審美感知。
圖7. 牛奶混入咖啡的過程,伴隨物理熵(複雜度)的增加
因此,論文作者最終區分了兩種複雜度度量:
第一種是熵複雜度(entropic complexity),用於測量圖像中的信息量,根據熱力學第二定律,在咖啡/牛奶實驗中,熵複雜度只能是時間的遞增函數;
第二種是結構複雜性(structural complexity),是考慮噪聲之外的特徵數量,這是時間的非單調函數,在非平凡混合模式(non-trivial mixing patterns)最顯著的中間階段顯示最大值,例如在咖啡/牛奶實驗混合實驗中的中間狀態。
在 Aaronson 等人研究基礎上**[7****],研究者將結構複雜性計算為無噪聲熵**,認為結構複雜性衡量了無噪聲熵的複雜性或趣味性。它通過對圖像的粗粒化處理得到,在數字圖像中等效於對圖像進行壓縮。
圖8. 上面三張圖中,雖然熵複雜度第二行最高,但人腦會認為第一行內容更豐富,也更美
為此,研究者在給定半徑後對以上黑白圖像應用的粗粒化過程,然後計算它們的結構複雜度τcg。
在下圖中,分別展示了圖像 a1、a4 和 a6 的黑白化(第二列)和粗粒化(第三列)過程。可以看到,圖像 a1 幾乎沒有變化,僅在區域邊界處有一條細灰線,因此估算τcg≈ τ;圖像 a4 稍微去噪,同時結構不變,有τcg ≲τ;不過,圖像 a6 被強烈去噪,粗粒化過程使它幾乎變成純灰色,暗示τcg ≪τ(遠小於)。
圖9. 分別展示了圖像 a1、a4 和 a6 的黑白化(第二列)和粗粒化(第三列)過程
在為兩組圖像計算結構複雜度,並在圖2上繪製為深紅色菱形後,如預期的那樣,結構複雜度τcg是非單調函數,在中間取得最大值。
因此,研究者的理論和實驗之間擬合獲得了更大的一致性:不僅最大值重合,曲線的整體形狀也相似。從而支持研究者做出結論,即**在粗粒化(去噪)之後的結構複雜性是人們對平均圖像偏好的更好的代表指標。並且,這個指標不僅更符合人腦的格式塔知覺過程,與自然圖像相匹配的偏好也達到了峯值。**從演化心理學看,這印證了人們的審美偏好受到其自然環境的影響。
如何欣賞印象派作品
從上面結構複雜度作為審美指標,人腦對圖像進行格式塔感知過程,很容易讓我們想起印象派畫家們的作品。
圖10. 印象派之父莫奈的著名的「日出 · 印象」
印象派的誕生,一方面不滿於古典學院美術通過客觀知識對世界的機械建構,一方面又為了規避照相機發明對外部現實像素般精準的描摹。在印象派畫家看來,真實的世界是活生生的,它不可能出自黑暗中的畫室、用抽象的幾何和宏大的想象創造出來,也不可能存於鏡頭下的冰冷、如謊言般片面地截取世界的一隅,把無生命的切片當成真實本身。
也就是説,真實的世界,不是靜態的。人的眼睛不是鏡頭,人的大腦也不是機器。
因此,他們走出狹小的畫室,到大自然和人羣中去,用模糊的光斑和成塊的色彩,在繪畫中捕捉時間的腳步,在光影變化中注入情感,最終在朦朧中定格自己那一瞬間所感知到在呼吸的永恆。
如果不理解印象派畫家的理念和追求,那麼看他們作品往往就是一團團模糊的色塊,充滿潦草和混亂的筆觸,粗糙得好像未完成的草稿。甚至越仔細看,越是一頭霧水。但有經驗的藝術家和藝術愛好者們,往往會知道看印象派作品的幾個竅門:
1、眯着眼看
2、退後幾步看
3、閉上眼幾分鐘突然睜開眼看
這是什麼道理?其實就是因為印象派畫家們並非在畫一個物體形象,而是試圖再現真實的視覺過程。
在前面的圖像複雜度分析中,我們已經知道,對於有太多噪音的畫面,人腦會先有一個去噪的過程,這個過程就相當於對畫面進行粗粒化處理(數字圖像則是壓縮),因此人腦所見的畫面是對原始信息熵複雜度轉換後的畫面。這個畫面的結構複雜度才是人腦進行審美感知的指標。
那麼,從這個角度看,印象派畫家,就相當於懸置了大腦基於客觀知識對世界的認知,拋棄了繪畫最初對精確性形象的追求,只畫自己目之所見,因此相當於自己預先就對進畫面進行了粗粒化處理——按照格式塔心理學美學家魯道夫·阿恩海姆(Rudolf Arnheim)的觀點,當你眯着眼睛或退後一段距離後,這樣才能看清由光斑和色彩之間並置形成的一個良好的“格式塔構圖”。印象派之父莫奈自己也説:
我真希望自己一生下來是一個雙目失明的人,然後突然獲得視覺,抓起畫筆,再把所看到的一切全都畫下來。
所以我們能理解,印象派其實在追求更加真實的真實。通過神經科學對視覺研究我們知道,人腦最初看到的並非是一幅完成的圖像,各種形象、物體瞭然分明,如照片般絲毫畢現。而是經歷了一系列漸變處理:從對原始信號的初期處理 (V1)、到圖形背景分離 (V2) [8**]**、到方位動態 (V3)、到顏色 (V4)、到運動 (V5)……最終加上各種知識濾鏡創造出呈現的整體知覺。(這些不同處理分佈所在的視覺皮層,並非僅完成單一功能,而是很多同時在處理形狀、顏色、方位、運動等,但隨着層次會有不同加工深度)
圖11:圖像信息在人腦視覺皮層的處理過程
印象派家所畫的,就是在大腦視覺皮層結合經驗知識構圖之前,瞬間展現光影的目之所見——因此,在你以適當的距離和方式觀看印象派作品時,會隨着不同的凝視範圍和角度,從畫中看到身臨其境般的光影動態效果。
不需要講究透視、不需要講究構圖、不需要追求立體、不追求我知道“應該什麼樣子”的客觀,只是用非常直接的顏色,畫自己眼前所見的,這些跳躍的彩色光線的瞬間,就展現了更鮮活的真實。
當然,如果再向前進一步,我們會看到抽象藝術家們的創作了——那或許是更深一層的真實。
圖12. 左邊是貓頭鷹的視覺視野,右邊是康定斯基的抽象藝術作品(康定斯基經常借用通靈等神秘體驗獲得靈感作畫)
最終我們得以知曉,為什麼自然界中熵複雜度最高的圖像,在我們看來並沒有美感了。人類的大腦的知覺系統,隨着上百萬年演化,已經去除了無意義的噪音,篩選和過濾出了對人類最有利生存的信息——它可以被結構複雜度這種認知複雜度所度量。人們所感知的所看到的世界,也本身就是大腦進行藝術創造的結果。藝術家們,在突破自身的藩籬後,所畫出看似不真實的畫面,卻是捕捉到了更深層次的真實。
既然藝術本身就在創造真實,那麼存在普遍的美,它可以被某種秩序度量着,這是理所當然了。
參考文獻
[1] Reber R1, Processing Fluency and Aesthetic Pleasure,doi.org/10.1207/s15327957pspr0804_3
[2] George David Birkhoff,Aesthetic Measure
[3] G. J. Stephens, T. Mora, G. Tkacik, and W. Bialek, Physical review letters 110, 018701 (2013).
[4] Horgan J. 複雜性研究的發展趨勢—從複雜性到困惑[J]. 科學美國人, 1995 , 10 : 42-47
[5] 苗東昇,系統科學精要,215-216
[6] A.Desolneux, L.Moisan, and J.-M.Morel, From Gestalt Theory to Image Analysis (Springer New York, 2008).
[7] S. Aaronson, S. M. Carroll, and L. Ouellette, “Quantify- ing the rise and fall of complexity in closed systems: The coffee automaton,” (2014), arXiv:1405.6903
[8] Figure and Ground in the Visual Cortex: V2 Combines Stereoscopic Cues with Gestalt Rules
[9] B.Spehar and R.P.Taylor, in Human vision and electronic imaging XVIII, Vol. 8651 (2013) p. 865118.
本文經授權轉載自微信公眾號“集智俱樂部”。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』開通了按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
相關閲讀