相信數據?並非總是,但你仍應該使用它 - 彭博社
Allison Schrager
這是大量的數據。
攝影師:Jonathan Nackstrand/AFP
我被金融吸引是因為它承諾在混亂中帶來一些秩序。這裏有一個市場,每天有數十億筆交易 —— 但它設定了每個資產的價格,這個價格將未來風險的價值放在了一個字面上的數字上,或者更準確地説,人們在當今時代評估這些風險的價值有多高。世界充斥着信息 —— 關於個別公司,關於宏觀經濟,關於地緣政治風險,關於(不要太元)價格本身 —— 而這個價格幾乎瞬間就將所有這些信息都融合了進去。這就是市場效率的定義。
Bloomberg觀點拜登的住房議程需要翻新最高法院仍然存在倫理問題這是拜登的繁榮經濟,蠢貨!特朗普主義正在清空教堂除了一件小事:這個數字,這個價格,一直都有點錯誤。事實證明,數據存在問題。
金融界的激烈爭議提醒人們,任何人曾經擁有的任何確定性都是一種幻覺。這涉及一篇學術論文,質疑因子投資的好處,投資者根據“因子”(如公司規模或其股價與資產價值的比較)做出決策。理論上,這種投資可以帶來比整個市場更好的回報。
這篇論文認為,因子投資之父肯尼斯·弗倫奇和尤金·法瑪公開收集的數據隨時間變化 — 當數據發生變化時,因子和它們對投資組合的價值估計也會發生變化。確實,新舊數據都表明因子投資有益,但具體效益取決於使用哪些數據。
數據變化時,預期回報也會變化
1926年投資於價值股票的1萬美元在將近八十年後會值多少?這取決於你使用哪些數字
來源:帕特·阿基、阿德里安娜·羅伯遜和米哈伊爾·西姆廷,基於法瑪-弗倫奇數據庫的數據
這不僅僅是一場學術爭論。因子模型在商學院中被教授,並經常用於評估市場表現和資本價格。法瑪和弗倫奇還與一家名為Dimensional Fund Advisors(DFA)的共同基金公司有關,該公司提供過度配重因子的基金。DFA員工以一種對外人不透明的方式協助處理法瑪/弗倫奇數據。
完全披露:我在10多年前曾與法瑪和弗倫奇在DFA一起從事另一個與此無關的數據項目。一個讓我印象深刻的教訓是,無論數據來源如何,所有金融數據都非常嘈雜。通過金融數據做出的大多數估計對所選擇的時間範圍和所做的任何假設都非常敏感(並且必須始終做出假設)。沒有人應該將金融變量的估計視為實際事實。
構建數據集需要做出許多判斷,數據通常會隨着更多信息的獲得而進行修訂,無論是通過法規變化還是測量實踐的變化。因子數據尤其嘈雜,因為它們需要對應該進行哪些計算以定義“價值股票”或小公司做出假設。這是一個非常容易受到解釋的過程。
噪音不僅是金融數據生活中的一個事實,它也存在於經濟數據,健康數據甚至Reddit評論數據。正如偉大的Fischer Black在他幾乎40年前發表的關於數據噪音的有遠見的文章中所説:“我認為幾乎所有市場幾乎所有時候都是有效的。‘幾乎所有’意味着至少90%。”
即使90%也會產生很多噪音。
數據不僅描繪了過去的模糊圖景,也模糊了我們對未來的視野。數據無法掩蓋價值投資近年來表現糟糕,或者小型公司的前景可能並不樂觀,因為大型科技公司繼續主導市場。
這可能只是這些因素偶爾經歷的困難時期,正如它們有時會經歷的那樣。或者這可能表明更深層次的變化。一個重視無形資本——知識產權而不是機器——的市場可能意味着價值股將獲得較低的回報。一個更重視規模化和主導市場能力的經濟可能意味着小公司的價值會降低。一個不斷變化的世界意味着更不可靠和更具波動性的估計。
隨着社會科學中的複製危機持續發展,重要的是要注意,很少有學者被發現不誠實。許多差異只是反映了使用數據的任意性,以及研究人員不得不做出的任何假設。大數據時代應該帶來更一致和可靠的工作 — 但大量數據也可能包含大量噪音。
金融領域的這種爭議具有啓發性。數據量令人震驚,不僅涉及市場交易,還涉及諸如醫療干預等事物。數據通常充滿噪音,甚至最新的工具 — 我在談論你,人工智能 — 也無法使其完全可靠。隨着我們進入一個數據更加易於獲取的世界,我們應該更加意識到其侷限性。
我這裏並不是在提倡後現代主義。數據仍然是一種非常有價值的工具,可以幫助人們做出更理性和知情的選擇。布萊克的90%估計大致正確 — 而90%要比沒有好得多。即使有很多噪音,數據仍然顯示因子投資可以是一種穩健的策略和了解市場的好方法。但在大數據的世界中,我們都需要為一些大噪音做好準備。這意味着永遠不要假設精確性,並用我們自己的老式人類判斷來調和數據告訴我們的內容。
在彭博觀點的其他地方:
- 寧可將那些就業數據扔到牆上:約翰·奧瑟斯
- 忘記你在過去20年中學到的有關投資的知識:梅琳·薩默塞特·韋伯
- 糟糕的大數據研究可能動搖你對科學的信仰:加里·史密斯
欲瞭解更多彭博見解,請訂閲我們的新聞簡報。