統計検定2級向けに役立ちそうな知識をメモ
第1種の過誤、第2種の過誤、検出力
YouTube統計チャンネル 統計[47/50] 第1種の誤り,第2種の誤り,検出力【統計学の基礎】
をまとめました。
混同行列で整理します。
仮説検定の判断 Predicted | |||
\(H_0\)採択 | \(H_1\)採択 | ||
実際 Acutual | \(H_0\)正しい | 真陽性 TruePositive | 第1種の過誤 偽陰性 FalseNegative |
\(H_1\)正しい | 第2種の過誤 偽陽性 FalsePositive | 検出力(=確率) 真陰性 TrueNegative |
問題:離散型確率変数Xの分布が以下のいずれか
棄却域X>=5とするとき、第1種の過誤の確率、第2種の過誤の確率、検出力を求めよ
\(H_0\) | X | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
P | 0.2 | 0.3 | 0.2 | 0.1 | 0.1 | 0.1 | 0 | |
\(H_1\) | X | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
P | 0 | 0.1 | 0.1 | 0.2 | 0.3 | 0.2 | 0.1 |
答え
\(H_0\) | X | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| P | 0.2 | 0.3 | 0.2 | 0.1 | 0.1 | 0.1 | 0 |
\(H_1\) | X | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| P | 0 | 0.1 | 0.1 | 0.2 | 0.3 | 0.2 | 0.1 |
第1種の過誤の確率 0.2、第2種の過誤の確率 0.4、検出力 0.6
標本不偏分散:「n」ではなく「n-1」で割る理由
分散は
\(\sigma^2=\frac{1}{n}\sum(x_i-\bar{x})^2 \)
となりますが、
母集団の分散を標本から推定する場合(=標本不偏分散)は、
\(u^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2 \)
と、nではなくn-1で割ります。
n-1で割る理由はわからなかったものの、最初は「そういうもの」として考えないようにして進みましたが、2級の範囲が一通り終わったところで理由を調べてみました。
標本分散は母分散より小さくなります。
\(\frac{1}{n}\sum(x-\mu)^2 \geq\frac{1}{n}\sum(x-\bar{x})^2 \)
違いは\(\mu\)と\(\bar{x}\)です。\(\bar{x}\)もばらつくからです。
\(\bar{x}\)のばらつき1個分(\(\frac{\sigma^2}{n}\))を足すと等しくなります。
標本の分散に、標本平均のばらつきを足すと母分散の推定になる
\(\sigma^2=\frac{1}{n}\sum(x-\bar{x})^2+\frac{\sigma^2}{n}\)
\(\sigma^2(1-\frac{1}{n})=\frac{1}{n}\sum(x-\bar{x})^2\)
\(\sigma^2(\frac{n-1}{n})=\frac{1}{n}\sum(x-\bar{x})^2\)
\(\sigma^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2 \)