統計検定2級のメモ

経理と機械学習

統計検定2級向けに役立ちそうな知識をメモ

第1種の過誤、第2種の過誤、検出力

YouTube統計チャンネル 統計[47/50] 第1種の誤り,第2種の誤り,検出力【統計学の基礎】
をまとめました。

混同行列で整理します。

仮説検定の判断
Predicted
\(H_0\)採択\(H_1\)採択
実際
Acutual
\(H_0\)正しい真陽性
TruePositive
第1種の過誤
偽陰性
FalseNegative
\(H_1\)正しい第2種の過誤
偽陽性
FalsePositive
検出力(=確率)
真陰性
TrueNegative

問題:離散型確率変数Xの分布が以下のいずれか
   棄却域X>=5とするとき、第1種の過誤の確率、第2種の過誤の確率、検出力を求めよ

\(H_0\)X1234567
P0.20.30.20.10.10.10
\(H_1\)X1234567
P00.10.10.20.30.20.1

答え

\(H_0\)X1234567
P0.20.30.20.10.10.10
\(H_1\)X1234567
P00.10.10.20.30.20.1

第1種の過誤の確率 0.2、第2種の過誤の確率 0.4、検出力 0.6

標本不偏分散:「n」ではなく「n-1」で割る理由

分散は
\(\sigma^2=\frac{1}{n}\sum(x_i-\bar{x})^2 \)
となりますが、
母集団の分散を標本から推定する場合(=標本不偏分散)は、
\(u^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2 \)
と、nではなくn-1で割ります。

n-1で割る理由はわからなかったものの、最初は「そういうもの」として考えないようにして進みましたが、2級の範囲が一通り終わったところで理由を調べてみました。

標本分散は母分散より小さくなります。
\(\frac{1}{n}\sum(x-\mu)^2 \geq\frac{1}{n}\sum(x-\bar{x})^2 \)
違いは\(\mu\)と\(\bar{x}\)です。\(\bar{x}\)もばらつくからです。
\(\bar{x}\)のばらつき1個分(\(\frac{\sigma^2}{n}\))を足すと等しくなります。

標本の分散に、標本平均のばらつきを足すと母分散の推定になる

\(\sigma^2=\frac{1}{n}\sum(x-\bar{x})^2+\frac{\sigma^2}{n}\)
\(\sigma^2(1-\frac{1}{n})=\frac{1}{n}\sum(x-\bar{x})^2\)
\(\sigma^2(\frac{n-1}{n})=\frac{1}{n}\sum(x-\bar{x})^2\)
\(\sigma^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2 \)

タイトルとURLをコピーしました