T分布 (T distribution)

我們知道如果從常態分配的母體中所抽樣的樣本數夠多,那麼這些樣本的表現就足夠代表母體的性質。但萬一樣本數不多的話還能適用嗎?為了解決這樣的問題於是誕生了T分布,其英文名稱是Student’s T distribution。統計上的分布通常以發現人的名字來命名或用淺顯易懂的字眼來命名,如果按照此邏輯T分布是一位叫做Student的人發現的?答案當然不是,這個分配背後有一個有趣的小故事。真正發現T distribution的人是戈斯特(William Sealy Gosset),但是如果用本名發表論文的話,會因為洩露公司商業機密的因素而被駁回。於是戈斯特就用Student的化名來發表。至於更詳細情形可參考統計人物小傳─戈斯特

以下是T分布的數學式:

T分布有一個參數,就是自由度(degree of freedom) ν。

令X為一連續隨機變數,若X符合T分布,其機率密度分布函數為(P.D.F)為:

(其中Γ為Gamma函數)

T分布的機率密度函數圖形:

附錄:T分布圖R程式碼

x=seq(-5,5,by=0.01)
df=c(1,2,5,Inf)
plot(x, dnorm(x,0,1),"l",lty="dashed", ylab="f(x)",ylim=c(0,0.45),main="Student’s T Distribution",cex.lab=1.2, cex.axis=1.2)
legend.name=NULL
for (i in 1:4){
lines(x,dt(x,df[i]),col=i+1)
legend.name[i]=paste("df =",df[i])
}
lines(x, dnorm(x,0,1),lty="dashed")
legend(2,0.4, legend.name, lty =1,col=(2:5), cex=1.2)
text(-2,0.44, "※Black dashed line represents standard normal distribution",cex=0.6)