母分散の不偏推定量

母平均が μ、母分散が σ2 の母集団から取り出した標本データ x=(x1,x2,,xn) から 母分散の不偏推定量=不偏分散 s2 を求めます。

参照しました資料は https://qiita.com/DeepMata/items/ee9547e154fefd6e952c です。

ϵi=xiμ 」かつ 「 ij のとき ϵiϵj は独立」と前提すると、E(ϵi)=0,V(ϵi)=σ2=E(ϵi2) さらに、ϵ¯=1nϵi と置くとx¯=ϵ¯+μとなるため、 E((xix¯)2)=E(((ϵi+μ)(ϵ¯+μ))2)=E((ϵiϵ¯)2)=E((ϵi1ni=1nϵi)2)=E((ϵi(1nϵi+1nj=1,jinϵj))2)=E((ϵi1nϵi1nj=1,jinϵj)2)=E((n1nϵi1nj=1,jinϵj)2)=E((n1nϵi)2+(1nj=1,jinϵj)22(n1nϵi)(1nj=1,jinϵj)) ここで右辺の、2(n1nϵi)(1nj=1,jinϵj) の過程に現れる (ϵij=1,jinϵj)E(ϵiϵj)=0 であるため、2(n1nϵi)(1nj=1,jinϵj)=0となり、 E((xix¯)2)=E((n1nϵi)2+(1nj=1,jinϵj)2)=(n1n)2E(ϵi2)+1n2j=1,jinE(ϵj2)=(n1n)2σ2+1n2j=1,jinE(ϵj2)=(n1n)2σ2+1n2(n1)σ2=((n1n)2+1n2(n1))σ2=(n22n+1+n1n2)σ2=(n2nn2)σ2=n1nσ2

よって、 1n1E((xix¯)2)=1nσ2=1nE((xiμ)2) シミュレーションで母分散の不偏推定量(不偏分散)を確認します。

N(0,3) に従う母集団( N=10000 )から 1000組 のサンプル( n=20 )を生成し、それぞれの組の「不偏分散(分母は n-1 )」と「分母を n とした場合の分散」のベクトル(それぞれ v1v2 )を作成します。

始めに母分散 σ2 を確認します。

set.seed(20240630)
v1 <- v2 <- vector()
N <- 10000
X <- rnorm(N, mean = 0, sd = 3)
n <- 20
for (i in seq(1000)) {
  x <- sample(x = X, size = n, replace = T)
  v1[i] <- sum((x - mean(x))^2) / (n - 1)
  v2[i] <- sum((x - mean(x))^2) / n
}
sum((X - mean(X))^2) / N
[1] 9.150467

続いて分母を n-1 とした不偏分散のベクトルの平均値等を確認します。

summary(v1)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  2.055   6.832   8.777   9.174  11.027  23.471 

最後に分母を n とした場合の分散のベクトルの平均値等を確認します。

summary(v2)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.952   6.491   8.338   8.716  10.476  22.297 

以上です。