佛蘭克‧威爾卡森 Frank Wilcoxon (1892~1965)

1940年代時,一位在化學工廠American Cyanamid工作的化學家Frank Wilcoxon被一個統計問題所困擾著。他使用”Student”的T檢定與Fisher的變異數分析方法,檢定比較不同處方之間的效用差異。在當時,像這樣分析實驗資料方式可說是一套標準的分析流程。但是這些方法卻不怎麼適用於Wilcoxon在實驗中所得到的資料。

他試著做一連串的實驗,而這些實驗對他而言不同處方之間的效用都是有非常明顯的差異。但是T檢定所得到的結果卻有時候顯著,有時候反而不顯著。尤其是在進行一連串化學實驗時,化學反應爐一開始沒有充分地加熱,就會常常發生這種現象。或者是有特定的催化劑正好要改變性質進行化學反應時也會偶爾發生類似現象。像這些會推得錯誤結論的實驗數據裡頭當中,通常是有某一個數值不是太大就是太小。實驗結論的異常有時候可以歸咎於這個奇怪的數值。但是有時候卻找不到有任何明顯的原因可以解釋。

Wilcoxon重新檢視了T檢定與變異數分析的公式,並且了解到這個異常極端的數值會嚴重地影響到檢定結果。他直覺地想到將這些離群值移除,並將剩餘的資料重新套用T檢定。但是對於一位化學家而言,後續問題接踵而來,哪些是離群值?要移除掉多少個離群值?離群值剔除後T檢定的機率表格還能適用嗎? Wilcoxon翻遍文獻確定以前是否有數學大師推導出統計方法解決那些問題。但是卻找不到任何一篇相關的論文。Wilcoxon後來想了一個方法解決,就是根本不使用原本的統計公式,而是將觀察的資料用排列組合的方式進行比較並且使用繁冗的計算過程。

Wilcoxon心裡想這是多麼笨的一個方法,只有像我一樣的化學家才會研究這種原理簡單但是繁冗的計算公式。在統計界中一定早有某人做過類似的工作!但是他翻遍統計文獻也是找不到類似的論文。他為了確認僅靠他自己所學的數學而推得的方法可行,於是將研究結果投稿至Biometrics期刊。縱使已經投稿了,他還是認為這不可能是他自己原創的方法,認定期刊的審查委員一定知道有類似的結果早已發表進而退回他的論文。一旦拒絕了,審查委員就會告知有那些文獻可以參考。但是,就連審查委員與期刊總編也不知道有類似的統計方法。最後認定這是一個全新原創的統計方法「the two-sample rank sum statistic and the one-sample signed rank statistic」,並在1945年的期刊上刊登該篇論文。

在Wilcoxon論文發表前,所有的檢定統計量都是從某特定分配的估計母體參數而推得。但是Wilcoxon所推導出的檢定統計量卻沒有估計任何母體參數,只著重於比較觀察的資料與期望資料完全隨機時之間的散佈情況差異。因此這是一個全新的領域,無母數檢定。Wilcoxon的研究成果使得統計學發展繼Pearson時期後又更向前邁進一大步。