為何俄語網頁佔比這麼高?_風聞
code2Real-有人就有江湖,有code就有bug2021-12-27 11:01
我們來看看統計數據——

題目中的數據來自W3Techs,2021年12月24日,最新一期的排名如上圖所示。可以看到,在最近的排名中,中文網頁的佔比甚至被越南文超越了,而俄文則維持了第2的位置。
W3Techs的統計是根據Alexa前1000萬或Tranco前100萬的站點得出的,去掉了僅有默認頁面的站點、重定向的域以及大網站下面的子域名。從2011年至今,每年統計數據如圖所示——

可以看到,在2011年時,德文網站的佔比排名第2、日文第3、中文第4、俄文第5。從2011年開始,俄文網站的佔比逐年提升,並在今年1月達到頂峯,中文和德文網站的數量則逐年遞減。至於土耳其文、波斯文和越南文的網站佔比,主要是在2015年之後迅速提升的。觀察中文網站的佔比,可以發現,其佔比是在2013到2016年間迅速下降的.
全世界最大的在線百科維基,在許多國家都是瀏覽量前10的網站。維基百科上有關於各種語言百科詞條的統計,按總頁面數量統計,排名最多的是英文(沒有任何疑問),接下來分別是越南文、法文、宿務文、阿拉伯文、西班牙文、德文、意大利文、中文、俄文(總頁面數量包括詞條、討論、分類、重定向等各種頁面)。

按照詞條數量統計,排名前10分別為:英文、宿務文、瑞典文、德文、法文、荷蘭文、俄文、西班牙文、意大利文、波蘭文。
注:維基上的宿務文、瑞典文、Winaray詞條大多是由瑞典人Sverker Johansson創建的Lsjbot自動編制的,所以數量有些虛高,去掉後,前10可以加上埃及阿拉伯文和日文。所以按瀏覽量統計,排名前10分別為:英文、日文、西班牙文、德文、俄文、法文、意大利文、中文、葡萄牙文、波蘭文。
按照編輯次數統計,排名前10分別為:英文、德文、法文、西班牙文、意大利文、俄文、日文、中文、越南文、波蘭文。
按照編輯者數量統計,排名前10分別為:英文、西班牙文、法文、德文、中文、俄文、葡萄牙文、意大利文、阿拉伯文、日文。
按照活躍編輯者數量統計,排名前10分別為:英文、法文、德文、西班牙文、日文、俄文、葡萄牙文、中文、意大利文、阿拉伯文。
按照上傳圖片數量統計,排名前10分別為:英文、俄文、意大利文、德文、羅馬尼亞文、烏克蘭文、波斯文、希伯來文、芬蘭文、法文。
按照國家統計,在前蘇聯國家和朝鮮,人們最喜歡閲讀俄文版的維基,而中文維基的影響力大多僅限於中國。
按照維基百科的統計數據,俄文的維基社區,活躍度至少排在前6,而且俄國用户可能更專注於條目的完整和豐富,因此上傳圖片的數量高居第2。維基上波斯文、土耳其文、越南文社區也比較活躍,這些語種的網站,在前100萬網站中佔比也不低。
除了維基以外,俄文互聯網上還有許多別的百科網站——
俄羅斯大百科全書的網絡版。
https://www.krugosvet.ru/www.krugosvet.ru/
一個基於紙質百科,根據學科分類整理詞條的線上百科。
https://megabook.ru/megabook.ru/
網站基於Cyril and Methodius的各種百科全書創建,用户也可以自建詞條。
https://dic.academic.ru/dic.academic.ru/
http://www.rubricon.com/www.rubricon.com/
這兩個都是整合了數十上百本傳統紙質百科的聚合型網絡百科。
http://www.encyclopedia.ru/www.encyclopedia.ru/
關於百科全書的“百科全書”。

在互聯網出現之前,紙質書是人們主要的知識載體。根據維基上面的統計,目前,俄羅斯每年出版的圖書數量約為11.5萬種,排名世界第5。雖然每年出版的中文書數量高居世界第2,但根據國家新聞出版總署的數據,2016年後,我國每年新出版圖書呈現出逐年下降的趨勢,這兩年限制書號,情況也不樂觀。
綜合上面的數據,可以看到,在當今世界的知識生產方面,俄文還是非常有影響力的。雖然比不過英文,但基本和法文、德文、西班牙文、中文、日文在一個檔次。考慮到日文、德文使用區域有限,法文和西班牙文佔據優勢的西非和拉美地區,教育基礎、計算機技術、互聯網發展水平可能不如俄羅斯和前蘇聯地區,那麼俄語網站能有這麼高的佔比,還是可以理解的。
另外,如果有搜索國外論文、電子書和各種版權資源的體驗,應該也能感受到俄文區大佬的互聯網共享精神。
比如説,著名的免費學術論文下載網站Sci-Hub,它的創始人來自前蘇聯加盟共和國哈薩克斯坦。
再比如,下載國外電子書用的創世紀圖書館(Libgen),也是俄國人做的,其歷史可以追溯至蘇聯時期的самиздат文化。
所以俄文區的人們,是真的樂於輸出,且樂於分享啊。我們現在之所以能有那麼多免費共享的高質量資源,ta們功不可沒。
但問題是,為什麼中文網站的佔比,在整個世界上顯得如此之低?
要知道,這可是一個有14億人口,十多億網民的國家,經濟總量可以匹敵世界任何一個大洲,基礎教育和高等教育水平不低,歷史悠久,文化多元,互聯網產業蓬勃發展……從任何一個角度看,中文互聯網的比重都不該如此之低。
很多答案都提到了移動互聯網的因素。的確,各大廠商跑馬圈地,築建護城河,發展出一系列大而全,卻禁止搜索引擎抓取內容的內部生態。將人們的注意力吸引到自家手機APP而不是網頁,確實大大擠佔了傳統網站的空間。
但這並不是全部原因。
記得在學生時對古生物感興趣,當年有更新及時,分類清晰的恐龍網,對天文感興趣,有牧夫天文論壇等各種天文網站。
作為對比,一個俄國天文網站:http://www.astronet.ru/ 雖然界面比較過時,但分類清楚,檢索方便,各方面的內容都不缺。
想要討論全面戰爭,找mod教程,有黃龍騎士團;要找文明系列資源,有塞愛維論壇;關注世界局勢和軍備動向,有超級大本營等等軍事論壇。
那時百度的貼吧還很熱鬧,刷貼吧不用登錄手機,沒有那麼多廣告貼,是真的有內容且活躍的討論空間。
那時中國的互聯網雖然沒有現在那麼普及,但各種小眾話題都有自己的討論空間。
到後來,就是各種回帖可見、用網站積分購買……
之後,是網站自帶下載器,掃碼關注公眾號,回覆提供解壓碼……
接着,是您所打開的資源已被刪除,網站論壇無人問津……
最後,是各大平台爭相搶佔流量,首頁無數美女教穿搭分享生活,熟悉的網站接二連三因備案、規則改變或難以運營而陸續關閉或限制討論……
互聯網是最能打破階層、地域、時間界限的工具之一。閉塞之地的人們能借助網絡看到外面的世界;身無分文的人們能通過網絡找到賺錢的機會,一無所知的人們能通過網絡找到各個領域的學習資源。
但是如今,我們的互聯網發展了,流量增加了,但真正可供學習、分享、討論,能夠沉澱下來的內容,也許還不如以前。不同的羣體有不同的需求,大而全的平台並不能替代小而美的社區。
未來,隨着互聯網元宇宙佈局完成,人們都被限制在元宇宙的信息繭房中,彷彿孫悟空跳不出如來的手掌心。