艾根‧皮爾生 Egon Pearson (1895~1980)

提到Egon_Pearson的統計成就,最先讓人聯想到的就是他與Jerzy Neyman合作發表的Neyman-Pearson Lemma。在1928年至1933年期間,他們兩人密切地信件交流促成彼此之間深厚的友誼關係。從信件內容可看出兩位大師級的人物如何激辯一個統計問題,雙方都提出更好的想法或者批評對方的理論。Pearson謙虛的性格讓他能小心謹慎評判出Neyman的某個方法可能不正確。而Neyman獨特的原創想法讓他在面對複雜問題時,能夠直接切入核心部份,找出各個困難的癥結點。

Pearson與Neyman第一個討論的問題就是Karl Pearson的卡方適合度檢定(chi square goodness of fit test)。這個檢定是被用來檢視觀察到的資料是否符合某特定的分配。但是這個檢定與其他一般檢定不同。只要有一組資料統計分析家就有無限多種的方式能運用到這個檢定。當時還沒有一個準則來判定哪一種分析方式是最好的。每次使用這個檢定時,統計分析家就只能做任意的選擇。Pearson將這個問題寫信給 Neyman,信件內容如下:

如果我將一筆資料套用卡方適合度檢定檢視是否符合常態分配,並且得到不顯著的P-value,那我怎麼知道這筆資料是真的符合常態分配?也就是說,我怎麼能夠確認其他版本的卡方適合度檢定或者是其他尚未發現的適合度檢定不會產生顯著的P-value,讓這筆資料不符合常態分配。

Neyman帶著這個問題回到華沙(Warsaw,波蘭首都)後,兩人的信件交流就開始了。他們兩人對於Fisher使用概似函數來估計的想法念念不忘。於是兩人試圖找出概似函數與適合度檢定之間的關連性。而他們兩人合作後第一篇的學術論文就因此而誕生了。這篇論文是他們合作所發表三篇經典論文中統計理論最艱深的,也帶動當時對於顯著性檢定觀念的變革。

但發表這篇經典論文卻有一個有趣的現象。在當時Biometrika算是頂尖一流的期刊,而Egon Pearson的父親Karl Pearson是負責該期刊的編輯。照道理說,該篇論文應該要在Biometrika上發表。但是這篇論文卻在Egon Pearson與Neyman合作所創立的新期刊Statistical Research Memoirs發表。原因出在於上一代兩位統計大師Karl Pearson與Fisher的交惡。Fisher認為Karl Pearson所提倡的卡方適合度檢定是有瑕疵的,並於1922年發表論文第一次批評Karl Pearson的這個檢定。而Karl Pearson則認為Fisher的概似函數估計法完全是無稽之談。但是Egon Pearson與Neyman的研究成果偏偏又是以概似函數觀念為基礎所推得的。在這種情況底下,Egon Pearson為了避免觸怒他的父親Karl Pearson,才會將這篇足以撼動統計學界的論文發表在一個名不見經傳的期刊上。

Egon Pearson另一個重要的成就就是藉由強調建立模型方法將統計理論推廣到工業運用上。他會對工業領域有興趣是因為他到北美時遇見了貝爾電話實驗室 (Bell Telephone Laboratories)的W.A. Shewhart (譽為統計品質管理之父) 。於1933年所發表一篇論文促進統計皇家學會工業與農業領域的雛形產生,及在1934年開始正式成為統計皇家學會期刊中的一部份。在1936年,他完成了一本著作(B.S. 600)關於工業標準化與品質管理的統計方法,成功地將統計理論推廣至工業應用上。