廣義極端值分布 (Generalized Extreme Value Distribution)

一些日常生活中的自然現象,像是洪水,豪雨降雨量,強陣風,空氣污染等等。這些自然現象平常很少能觀察到,但一發生卻又會造成重大災害。那麼要如何計算其發生的機率呢?極端值分布就是用來估算這些現象發生的機率。

以下是廣義極端值分布的數學式:

極端值分布有三個參數,分別為位置參數(location) μ、尺度參數(scale) σ、形狀參數(shape) k 。

令X為一連續隨機變數,若X符合極端值分布,其機率密度分布函數(P.D.F)為:

有一份記錄英國約克郡(Yorkshire)裡Nidd河的35年來每年最高水位的資料。

65.08

65.60

75.06

76.22

78.55

81.27

86.93

87.76

88.89

90.28

91.80

91.80

92.82

95.47

100.40

111.54

111.74

115.52

131.82

138.72

148.63

149.30

151.79

153.04

158.01

162.99

172.92

179.12

181.59

189.04

213.70

226.48

251.96

261.82

305.75

從直方圖我們可以看到35年最高水位的分佈情況集中在75至100之間,但是卻有少數幾年的水位突然高漲兩、三倍。在這種情況之下,如果用一般的分布去推估水位突然暴漲的機率一定會非常低,因為我們不希望只是因為沒有觀察到就低估它發生的機率。如果套用極端值分布去估計的話,可以推得分布中三個參數的數值分別是(location) μ = 36.15、尺度參數(scale) σ = 103.12、形狀參數(shape) k = 0.32。
我們就能利用這些估計參數來預測下一年最高水位,
其水位小於100的機率是0.566,
介於100到200之間的機率是0.192,
超過200的機率是0.242。

 

廣義極端值分布的機率密度函數圖形:

附錄:廣義極端值分布圖R程式碼

require(evd)
x=seq(-5,10,by=0.01)
y1=dgev(x, loc=0, scale=1, shape=0.5)
y2=dgev(x, loc=0, scale=1, shape=0)
y3=dgev(x, loc=0, scale=1, shape=-0.5)
plot(x,y1, "l" ,col=2, ylab="f(x)",ylim=c(0,0.5),main="Generalized Extreme Value Distribution", cex.lab=1.2, cex.axis=1.2,lwd=2)
lines(x,y2,col=3,lwd=2)
lines(x,y3,col=4,lwd=2)
legend(4,0.5,c( "K=0, Type I" ,"K>0, Type II", "K<0, Type III"), lty =1,col=c(3,2,4), cex=1.2)