文系経理が統計検定2級に合格した話

経理と機械学習

とんでもなく古いJTC経理勤務です。データに基づき、科学的に経営する、みたいなことをなにかしらできないかな、と夢想してたどり着いたのが統計学です。

2022年10月統計検定2級合格!

世のブログをみると3カ月とか4カ月で受かるらしいですが、かれこれ1年くらいかけて受かりました。

なんといっても、数学です。数学が苦手で文系に逃げたはずが、うん十年ぶりに向き合うことになりました。つらい・・・
確率統計、微分積分関係で、高校文系数学のおさらいと初めての高校理系数学をざっと頭に入れるのに1年近く費やしました。

勉強期間

2021年6月に開始

1日1時間

合格は2022年10月

スタート時のレベル

・文系経理で生きてきました。統計、数学は、学校でも会社でもすれ違いです
数学が嫌いなので文系
・AI(機械学習)に興味があったので、数学はかる~く見直してはいた

導入編

統計学の図鑑を通勤時間でざっと読む。
これはあまり意味はなかったです。

統計WEB・統計学の時間」の「練習問題を解いてみよう」を通勤時間で眺め解く(計算はしない)。
全体がざっと頭に入り、基本的な言葉を覚えることができた。
お薦めです!

統計検定2級対応 統計学基礎(日本統計学会)
私のレベルでは「???」な感じです。ただし、数学まわりが頭に入っている人には十分なのかもしれません。知らんけど。

分布で足踏み

さまざまな分布がでてきますが、わかりません。

まずは分布の式の導出から、一つ一つ、ヨビノリさんなどで勉強です。

離散型は、2項分布、ポアソン分布、一様型分布、幾何分布
連続型は、一様分布、指数分布
長い道のりです。
これが分かってる人、式を眺めてさくっと理解できる人、こういう人たちは、2級には苦労しないでしょう。「2か月で合格」みたいな人たちです。
試験合格のためだけであれば「覚える」ことでクリアできますが、多少なりとも理解しようと足掻いたので時間はかかりました。
それでも理解をあきらめスルーした部分は多いので、合格はうれしいけど、モヤるところはありますね。

演習編

統計学演習(培風館) これを基本に計算演習をしました。実際の2級試験からはちょっと違うかもしれません。これでなくてもいいと思いますが、といって、他に何かお薦めがあるわけでもありません。

基礎統計学Ⅰ 統計学入門(東京大学出版会)あまり理解できませんでした😢

統計検定2級 公式問題集 日本統計学会 とにかく過去問を繰り返すべし!

標本不偏分散:「n」ではなく「n-1」で割る理由

分散は
\(\sigma^2=\frac{1}{n}\sum(x_i-\bar{x})^2 \)
となりますが、
母集団の分散を標本から推定する場合(=標本不偏分散)は、
\(u^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2 \)
と、nではなくn-1で割ります。

n-1で割る理由はわからなかったものの、最初は「そういうもの」として考えないようにして進みましたが、2級の範囲が一通り終わったところで理由を調べてみました。

標本分散は母分散より小さくなります。
\(\frac{1}{n}\sum(x-\mu)^2 \geq\frac{1}{n}\sum(x-\bar{x})^2 \)
違いは\(\mu\)と\(\bar{x}\)です。\(\bar{x}\)もばらつくからです。
\(\bar{x}\)のばらつき1個分(\(\frac{\sigma^2}{n}\))を足すと等しくなります。

標本の分散に、標本平均のばらつきを足すと母分散の推定になる

\(\sigma^2=\frac{1}{n}\sum(x-\bar{x})^2+\frac{\sigma^2}{n}\)
\(\sigma^2(1-\frac{1}{n})=\frac{1}{n}\sum(x-\bar{x})^2\)
\(\sigma^2(\frac{n-1}{n})=\frac{1}{n}\sum(x-\bar{x})^2\)
\(\sigma^2=\frac{1}{n-1}\sum(x_i-\bar{x})^2 \)

【参考】
熊野コミチ 統計とお仕事チャンネル【YouTube】
「標準偏差の疑問、なぜN-1で割るのかをついに解説!【これで、スッキリだぜ】」
この動画はこの本を元にしているとのことです。(私は読んでいません)
入門統計学 検定から多変量解析・実験計画法・ベイズ統計学まで 栗原伸一/著

なお、不偏分散の平方根は標準偏差の不偏推定量にはならないようです。
(上記のYouTubeでは「不偏標準偏差」について誤解を生む表現があります)
標本不偏分散の謎がわかると標本不偏標準偏差の謎がでてきました!
以下、解説がありますが私は理解できていません(笑)

不偏分散の平方根は標準偏差の不偏推定量か 統計WEB
不偏標準偏差とは? 井口豊(生物科学研究所,長野県岡谷市)
「不偏分散の平方根」は不偏標準偏差ではない件(メモ) 初学者の統計学習ノート

不偏標準偏差の求め方
\(D=\sqrt{\frac{n-1}{2}}\frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})}u=\sqrt{\frac{n}{2}}\frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})}s\)
不偏分散に係数をかける 水増し係数
よく用いられているらしい近似式 近似式

しかし、不偏分散の平方根を不偏標準偏差としているサイトは多いようです。
不偏分散の平方根は不偏標準偏差じゃなかった 静粛に、只今統計勉強中ブログ
何が何やら?

Pythonで試してみたブログもありました。
標準偏差の不偏推定量はホントに不偏なのか、「コインを一万回投げて」確かめてみた

もう一度、試験勉強するならこうする

統計WEB・統計学の時間」の「練習問題を解いてみよう」を通勤時間で眺め解く(計算はしない)。

統計検定2級 公式問題集 日本統計学会 とにかく過去問を繰り返すべし!

タイトルとURLをコピーしました