正態分佈公式為什麼長這樣?_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!1小时前
正態分佈是最常見的連續概率分佈,在日常生活和科學研究中都起到重要作用。正態分佈的密度函數具有數學美感,但很多人並不知道它是如何得到的,本文介紹兩種推導方法。
撰文 | Long Luo
圖1. 68-95-99.7 Rule
什麼是正態分佈?
數據可以用不同的方式“分佈”,比如數據可以向左散佈的多一些,也可以向右散佈的多一些,或者分佈的亂七八糟,如下圖 2 - 4 所示,
圖2. 數據偏向左散佈
圖3. 數據偏向右散佈
圖4. 數據隨機分佈
但數據經常會集中在一箇中心值的附近,而不向左或右偏斜,像一個鐘形,如下圖 5 所示。
圖5. 數據正態分佈
正態分佈,又稱高斯分佈,是一種重要的概率分佈,是由數學王子高斯[4]在 19 世紀初提出的。有很多日常現象都符合這種分佈,如人的身高、考試成績等。正因為它幾乎無處不在,所以叫 Normal Distribution 。德國曾經發行的一款 10 馬克的紙幣上就印着高斯和正態分佈曲線,如下圖 6 所示。(編者注:正態分佈可能最早出現於棣莫弗關於n的階乘工作中。)
圖6. 高斯和正態分佈曲線
這個曲線的數學公式大家在中學裏都早已見過,如下所示:
正態分佈公式怎麼來的?
有很多種方法都可以推導出正態分佈公式,這裏將介紹一種既優雅又直觀的推導方式,由天文學家赫歇爾(John Herschel) [5]在 1850 年給出的。3Blue1Brown 的視頻 Why π is in the normal distribution (beyond integral tricks) 中詳細介紹了這種方式。不過視頻中有一些不夠嚴謹的地方,下面會先介紹視頻中的推導方法,然後再介紹嚴謹的數學分析法。
3Blue1Brown Herschel 推導方法
圖10. 落點概率密度函數只與半徑有關
更嚴謹的數學分析法
上一節我們使用了不那麼嚴謹的方法得到了正態分佈的概率密度函數,下面我們使用另外一種方法求出正態分佈的概率密度函數。
圖12. 落點概率密度函數