二項分布 (Binomial distribution)

根據2009年4月20日報紙刊載,台南縣玉井派出所後方庭園有一奇石,據說摸石能生男,不少外地民眾慕名而來,已成為觀光景點。假設今天有記者想要查證,這塊石頭是真有奇效,還是吸引觀光客的噱頭,那該怎麼做,才能証明呢? 最直接方法就是調查所有懷孕前摸過奇石的婦人,追蹤她們之後生男生女的比率,如果生男的比率真的較高,就可以證實這件傳聞了。但實際上,記者大人有很多事情要忙,不可能一一去調查所有摸過奇石的婦人,那要怎麼作才能既符合效率又兼顧正確性呢? 這就要靠統計的幫忙了!

當某一事件僅會有兩種狀況發生,且兩種狀況發生的機率是固定的,若定義這兩種狀況之一為成功事件,成功事件發生的機率為P,則連續做了n次獨立的事件,其中成功事件發生的次數就是二項分布。比如說丟一個銅板只會有正面或反兩面兩種狀況(當然,銅板站立的狀況不在討論範圍),若是一個公正的銅板,則正反兩面的機率各是1/2。當我們連續丟了10次公正的銅板,每一次擲銅板都是各自獨立的事件,則擲10次中銅板中正面朝上的次數,就是一個二項分布。

以下是二項分布的數學式:

二項分布有兩個參數:次數n及事件發生機率p 。

令X為一不連續的隨機變數,若X符合二項分布,其機率分布函數(probability function)為:

N=10, p=0.5的二項分布機率函數圖:

由前段的介紹,我們知道,若調查n名摸過奇石的婦人,有x人生下男孩,這就是一個次數為n,成功事件次數為x,成功事件發生機率為p的二項分布。先假設奇石沒有效果,則按照一般自然狀況,生男孩的機率為0.5,則我們只需調查部分摸過奇石的婦人,然後根據資料,檢定生男孩的機率是否高於0.5(p>0.5)就可以了。

附錄:二項分布圖R程式碼

rm(list=ls())
n <- 10
p <- 0.5
x <- 0:10
f <- dbinom(x, size = n, prob = p)
barplot(f,space=0.2,col="green",names.arg= as.character(0:10),xlab="x",ylab=quote(f(x)),ylim=c(0,0.25))