大數據解讀《流浪地球》豆瓣評分為何從8.5分降至7.9分_風聞
观察者网用户_239226-2019-02-25 09:11
截止到今天,《流浪地球》總票房已經突破40億,成為中國影史票房第二的作品。與此同時,流浪地球在豆瓣上的評分也從8.5下降到7.9,兩者的背離引發的討論,其熱度完全不亞於《流浪地球》內容本身的討論。
但事實上,這個下跌,從8.5到現在的7.9,或許並沒有什麼特殊的。
1,許多電影上映後都出現了豆瓣分數逐漸下跌的現象。四部春節檔電影,分數下跌也都不比《流浪地球》少。
抓取的豆瓣數據,在2018年的電影裏,《唐人街探案2》、《超人總動員2》、《李茶的姑媽》、《神奇動物:格林德沃之罪》、《無敵破壞王2:大鬧互聯網》,都在上映一週內分數下降0.5。更別説我最喜歡的《海王》了,人家從8.5下降到了7.7,嚶嚶嚶(拜託可別在本答案下刷海王真難看的評論了)。
2,《流浪地球》的分數下降,和其他分數下降的電影一樣,主要是由三星和四星的比例上升導致的。一星比例高達2%,而雖然偏離同等電影的正常水平,卻對總分影響甚小。如下圖所示,在當前的分數結構下,即使把2%的一星全部扔掉,平均分也只能增加0.1分。

事實上,豆瓣的抨擊者並不是對這些數字一無所知。一開始,他們説豆瓣分數下跌不正常;過幾天,他們承認分數下跌幅度或許正常,但一星比例高得不正常;再到後來,發現2%的一星比例對總分影響不大,但又認為豆瓣熱評首頁裏差評太多……
總之,這個板子,是一定要打到豆瓣身上去了。
但**【已經花了300塊錢購買了3張IMAX影票帶全家去觀看了《流浪地球》的】**我覺得,因為對網站的評價不滿意,就把板子打在豆瓣這個app身上,似乎也有些莫名其妙。畢竟一星的評分是用户自己去打的。熱評首頁中差評排序居多,那幾萬票「有用」也是用户自己投上去的。
比如豆瓣到現在還排名第一的左丘失明的長評——

人家確實有5.6萬個踩,但也有4萬多個贊,這不是一個小數字吧?

再比如對《流浪地球》的短評。上圖是熱評的前三名,第二和第三名都打了一星,加起來有10萬個贊。其中排名第二的「嘟嘟熊之父」,現在有6.5萬個贊,比一星期前增加了4萬多個。
而《流浪地球》的一星評價數量,在同期只增加了1.5萬個。
對「嘟嘟熊之父」的一星短評的贊同增量,遠遠多於實際的一星評價的增量。這意味着什麼?
這意味着——很多人確實沒有發表評論,也沒有給《流浪地球》打一星,也許是因為打一星會顯示在頁面上。他們只是靜悄悄地找到符合自己想法的評論,然後點了一個不能被別人看到的贊。
這讓我想到2016年的美國總統大選,公開場合下大家都不喜歡特朗普,所有的民調都不看好特朗普,媒體也説特朗普這不好那不好,看上去希拉里民心所向……
然後特朗普贏了。
在大選時,因為不喜歡一個人而選擇另外一個人是常見的現象,但對電影來説,不存在直接的反對機制。我不喜歡看這個電影,也沒法賣空,也不會拼命去看另一部電影,這沒意義。所以要是不喜歡一部電影,除了評論和在軟件上打分,其他也啥都做不了。
因此,戰場才匯聚到了豆瓣身上。
但正如希拉里敗選後沒法去怪罪大選制度一樣,因為豆瓣上的差評在首頁排名很高就去怪罪豆瓣的話,還不如去想一下,那些讓你們看不順眼的一星差評,為啥會拿到6.5萬個、4萬個、3萬個【有用】?
把這幾萬個點贊全部當成【牧羊犬】【跪久了】,説幾句【爾曹身與名俱滅】之類的漂亮話,對理解這個問題,有幫助嗎?
短評第一名是5.6萬個【愛國者】,短評第二名是6.5萬隻【牧羊犬】,很讓人高興嗎?
這篇文章從這裏才真正開始。我們想要研究的一個問題是——豆瓣的用户,和真正去看電影的用户,究竟有什麼不一樣?為什麼會不一樣?這樣的差異會造成什麼?
首先,我們給每一部電影做一個用户畫像。
電影的用户畫像並不好做,首先,在線購票的比例雖然到了九成,但並不知道這些票都是給誰買的。其次,對在線購票者本人來説,他們的畫像也不一定準確。
因此,我們使用人口普查分區縣數據和各區縣的票房和人次數據來完成這個畫像,步驟如下:



選取2012到2018年所有觀影人次在1000萬以上的電影,將三個數值分別作為一個三維空間的x、y和z軸作圖,可得下圖:

在上面的三維座標中,大於零的部分表示性別越偏男性/教育越高/年齡越小 越偏好於這部電影。用觀影人次排名前20的電影舉例,具體表格如下:
這個算法準不準呢?我們可以做一個檢驗,看每一個點的最近的鄰居分別是誰——兩個在三維空間裏距離較短的點,説明兩者的觀影人羣十分類似。我們實驗了四部不同類型的電影,分別找到離這四部電影最近的5個點,結果如下:

可以看到,在空間上最接近的幾個影片有相同的觀眾偏好,一般也處在同一個範疇內。比如到《復仇者聯盟2》距離最近的5部電影,有4部是漫威出品;在距離《熊出沒·變形記》最近的5部電影中,有4部都是熊出沒的系列片。
從直覺上看,這個算法還是能非常準確地將電影給劃分開來的。
特別有趣的是《戰狼2》,距離他最近的五個點分別是——
1,小時代3:刺金時代
2,小時代4:靈魂盡頭
3,美人魚
4,捉妖記
5,小時代:青木時代。
這説明《戰狼2》的觀影人羣畫像,和《小時代》系列是十分類似的。特別讓人驚訝的是,和我們的印象不同,《小時代》的性別係數和《戰狼2》一樣,都是正的,説明男性越多的地區,反而越偏好《小時代》。
而且我們可以看到一個現象——和戰狼2最接近的幾部電影,都創造了票房佳績。
每一部小時代都是當年票房的佼佼者,到了《美人魚》和《捉妖記》,這個偏好的觀眾人羣創造了當年的票房冠軍,更別提《戰狼2》了,他創造了中國影史票房冠軍。
這個現象也提出了本文的第二個問題——我們應該拍攝什麼樣的影片,吸引什麼畫像的人羣,才能儘可能吸引更多觀眾來觀影?
我們將性別、教育和年齡這三個指標分別和觀影人次的對數作圖,可以得到下面三張圖:



從上面三張圖中,我們可以看到:
1,過於偏向某一種性別的電影,不會有很好的票房,只有性別處在中間的時候,票房才更高。
2,讓年齡太低或者年齡太高的人特別喜歡的電影,票房也不會很高,也需要針對中間值來確定觀眾的偏好。
3,和性別、年齡的圖中出現的先上升、再下降的圖不同,教育水平的偏好關係和觀影人次似乎並沒有一個明顯的峯值,而是隨着教育提升,單調下降——越讓高教育人口喜歡的電影,票房越低。
我們將上面的第三張圖分成2015、2016、2017和2018年,可以看到一個更明顯的趨勢——

上面四條線的斜率,一年比一年大,這意味着低教育偏好的電影,帶來的觀影人次一年比一年高。
2015年和2016年時,低教育偏好的電影和高教育偏好的電影,在觀影人次上還差不多,從2017年開始兩者的關係變為顯著負相關,係數為-0.17,在5%水平上顯著。
2018年,低教育偏好能帶來更高票房,係數已經達到-0.22,在1%水平上顯著。
這意味着電影的目標觀眾教育水平越低,該電影的票房越高,而且兩者的相關程度還在不斷上升。
為什麼會這樣?答案非常簡單——高教育人口,已經不能貢獻增量票房了。
我們將中國3000多個區市縣按照其平均教育水平分為四個部分,分別是平均教育年限大於12年(全國前百分之1%水平)、10.9年到12年之間(全國前1%到全國前10%)、9.6年到10.9年之間(全國前10%到全國前25%)、9.6年以下(全國後75%水平),他們在2012到2018年的觀影人次如下圖所示:

從上圖可以看到,在教育水平最高的地區,觀影人次從2015年到2018年已經下降了6%!
教育水平次高的地區也有同樣的現象,從2015到2018年只上升了5%。
而平均教育年限在9.6年以下的地區,從2015到2018年的觀影人次上升了55%。
隨着中國的電影院在發達地區飽和,並向三四線城市蔓延,未來如果有人能夠對電影票房產生新的貢獻,那麼他們一定是三四線城市的人羣。
因此,新的賣座電影,必然是為這批觀眾量身定做的電影。
回到一開始的問題——為什麼會許多電影的豆瓣電影評分逐漸降低?那些豆瓣評分逐漸降低的電影,和電影本身的目標人羣特徵有什麼關係?
我們將豆瓣分數動態變化數據和我們用票房數據計算出的每一部電影的偏好鏈接在一起,看哪一個維度的指標和豆瓣的評分降低有關。
結果,只有一個指標有顯著相關性,他就是一部電影目標人羣的教育水平和電影偏好的係數。

上圖是豆瓣評分和電影傾向觀眾的教育年限之間的關係。可以看到,越傾向於高教育地區的電影,在豆瓣上都有越高的評分。

上圖是豆瓣開分和十天後的評分差額與電影傾向觀眾的教育年限之間的關係。散點圖的相關性在1%的水平上顯著,説明電影的目標觀眾人羣越傾向於低教育人口,豆瓣給他的評分下降就越多。
其中,位置在最上方,分數提高最多的電影是《無問西東》,豆瓣開畫6.7分,到第十天是7.7分(目前是7.5分),票房為7.5億。
而分數降低最多的是《後來的我們》,豆瓣分數從一開始的7.1,降低到第十天的5.9(目前仍為5.9),票房為13.6億。
最後理順所有的故事:
1,從2015年開始,那些比較發達、平均教育水平比較高的地區,觀影人次達到飽和,出現增長停滯,甚至下降。而那些欠發達、平均水平比較低的地區,觀影人次持續增長。
2,欠發達地區人口偏好度更高的電影,能夠帶來更高的票房,且兩者關係逐年增加。而豆瓣對這批欠發達地區偏好的電影更為苛刻,他們雖然常常拿到很高的票房,但是豆瓣評分卻往往逐漸降低。
3,電影的提供者當然會優先滿足快速需求的增長。在這種趨勢下,我們未來將看到更多為這批快速增長的欠發達地區觀影人羣量身打造的電影。
4,除非豆瓣的構成和中國觀影人羣的構成一樣快速轉變,否則,隨着電影供給向欠發達地區的偏好逐漸傾斜,豆瓣評分走低但票房又同時走高的現象,將會越來越頻繁地出現。