常態分布 (Normal distribution)

大家都有過去便利商店購買過飲料的經驗,如果細心一點注意的話,可以在飲料瓶上標識容量的那一欄上,看到除了容量外後面會加註有多少些微的誤差範圍。為什麼要標示這個容量誤差範圍呢?廠商當然希望每罐飲料的容量最好都是完美一致,但是生產時難免都會無法控制的因素造成每一罐微量的誤差。對廠商而言,當然不希望出現不符合容量標示的這種不良品。但是要怎麼訂定合理的誤差範圍呢?

這時統計中最常見且最廣泛運用的分布,「常態分布」,可以幫助我們解決這個問題。日常生活中許多現象都是符合常態分布,像是學校中所有學生的身高、體重、IQ智力等等。

以下是常態分布的數學式:

常態分布有兩個參數,分別為位置參數(location) μ、尺度參數(scale) σ2。當μ=0且σ2=1時,就稱為標準常態分布。

令X為一連續隨機變數,若X符合常態分布,其機率密度分布函數為(P.D.F)為:

常態分布的機率密度函數圖形:

附錄:常態分布圖R程式碼

x=seq(-6,6,by=0.01)
mean=c(-3,3)
var=c(0.5,4)
plot(x, dnorm(x,0,1),”l”,lty=”dashed”, ylab=”f(x)”,ylim=c(0,1),main=”Normal Distribution”, cex.lab=1.2, cex.axis=1.2)
legend.name1=NULL
legend.name2=NULL
for (i in 1:2){
lines(x, dnorm(x,0,var[i]),col=i+1, lty=”dashed”)
lines(x, dnorm(x,mean[i],1),col=i+3)
legend.name1[i]=paste("μ=",0, "σ2=",var[i])
legend.name2[i]=paste("μ=",mean[i], "σ2=",1)
}
legend.name=c(paste("μ=",0, "σ2=",1),legend.name1, legend.name2)
legend(2,0.95, legend.name, lty=c(2,2,2,1,1),col=(1:5), cex=1)