見出し画像

統計検定準1級学習記

はじめに

学生時代に数学は割とちゃんと勉強した経験はあるものの、社会人になってn年経ってほぼほぼ数学に触れなくなり、すべて忘れてしまって悲しいので何かを勉強しようと思い立ち、実務でも役に立つことがありそうな統計検定に挑戦することに。
どうせなら高度な数学的内容も勉強したいので、準1級に狙いを定めた。
(が、後から思うと諸々忘れている状態からならまずは2級からやったほうが勉強しやすかったなと思う。)
1級はPBTで年一しか受けられないのでハードル高い。CBTで受けられる準1級がちょうどいい。

統計学実践ワークブックを読んで例題が解けるようになればOKらしいのでやっていく。
記録として、章ごとの感想メモを書き連ねます。

ワークブック

§1 事象と確率

さすがに余裕。
鼻歌を歌いながら例題を解く。

§2 確率分布と母関数

確率母関数、モーメント母関数が早速あやしい。
微積分久しぶりすぎて全然できない。分数関数の微分のダルさ、懐かしい。
確率母関数、モーメント母関数経由で期待値と分散を求める方法は公式として覚えよう。母関数の導関数に1か0を代入する。分散を求める公式は微妙に異なるので注意。
この本だと定義だけいきなり与えられるけど、例えば東大出版会の「統計学入門」を見ると定義の気持ちも含めてかなり丁寧に説明してくれており、後からそちらを見て腹落ちした。
やはりこの本は幅広い試験範囲をコンパクトに収めることに重きを置いているので、関連情報は適宜別の文献を当たって補いながら勉強していくのが良い。
あと例題では二項分布、幾何分布、指数分布とかもいきなり出てくる。こいつらも普通に忘れていた。

§3 分布の特性値

変動係数、初見。標準偏差を期待値で割っただけなので簡単。
偏相関係数も初めて見た。覚えた方がいいですか?
(→別に覚えなくて良かった気がする)

§4 変数変換

はいむずい。
変数変換の式は何の補足も導出もなく所与のものとして出てくるので、別途調べて理解しておく。まぁ気持ちはなんとなくわかる。
例題をやって、そういえば正規分布のモーメント母関数の導出ってかなり計算面倒だったなという記憶が蘇る。ガウス積分が出てくるやつ。
一回眺めたら、大人しく結果を覚えましょう。

§5 離散型分布

二項分布、超幾何分布、ポアソン分布、幾何分布、…。
それぞれの意味は難しくないけど、期待値や分散はいちいちその場で導出するのも面倒なので覚えたほうがよさそう。
ポアソン分布は期待値も分散もλ。
幾何分布、最後の1回を含むか含まないかで世の中の定義がブレてるので注意が必要。

§6 連続型分布と標本分布

前章と同じく、分量が多くてウッとなる。
それぞれの分布はかなり淡々と導入されるので、適宜意味合いを調べながら理解する。
内容が多い割には、章末の例題には正規分布と指数分布しか出てこなかった。他のも覚えたほうがいいですか?
今後過去問とかもやりながら覚える範囲を判断していこう。

§7 極限定理、漸近理論

数学的に高度な内容でムズい。
ひとまず理論面はある程度割り切って例題が解ける範囲の理解をしっかりやっておく。
極値分布とか、へーって言いながら眺めるだけになってる。
連続修正ってなに?

§8 統計的推定の基礎

モーメント法、初耳。最尤推定量を、次数Kまでのモーメントを使った推定で近似する気持ち。
バイアス・バリアンス分解、クラーメル・ラオの不等式、フィッシャー・ネイマンの分解定理…… ムズい。
(追記:クラーメルじゃなくてクラメールで覚えてたので違和感あったけど、普通にテキストが間違いらしい)
十分統計量って昔もあんまりピンときてなかった気がする。
ジャックナイフ法、よくわからんけど頭よさそう。

§9 区間推定

導出も含めて、特に難しくはない。
いや、偏差平方和/σ^2が自由度n-1のカイ二乗分布に従うのってしれっと出てくるけどなんでだっけ?(p71)
→統計学入門を見ても、直観的説明だけで証明は省略されていた。他書では、証明は「本書の範囲を越えるので省略する。」とあった。相当高度なのかしら(だったらせめてそう書いて!)。
6章でなにこれって感じだったF分布はここで出てくる。
例題の数値計算がめんどう。

§10 検定の基礎と検定法の導出

検定の話。ここはだいたい知ってる。
検出力を考慮したサンプルサイズ設計の計算は慣れなくてちょっと戸惑った。絵を描きながらやろう。
抜取検査の話はただの組合せ論なので易しい。

§11 正規分布に関する検定

標本平均と標本分散が互いに独立って言えるのってなんでだっけ?(p86)
→統計学入門には「正規分布の密度関数の計算から」とだけあった。9章でも思ったけど、この本はコンパクトに収めるために証明を省略するのは仕方ないけどその旨を書かずに自明の事実のような記述で片付けているのは誠実さに欠けるな……。
なんの説明も無しに突然出てくるプールした分散って何?

§12 一般の分布に関する検定法

二項分布やポアソン分布の場合でも漸近的には正規分布に収束することを使って検定できる。
適合度検定の自由度に関する考え方、なんでこれが成り立つのかピンときてない。しれっとすごいこと言ってないですか?

§13 ノンパラメトリック法

疲れてきてたところに、数学的に難しくなくて直観的にわかる話が出てきてくれてたすかる。
クラスカル・ウォリス検定と順位相関係数は定義がややこい。覚えたほうがいい?

§14 マルコフ連鎖

楽しい。
問14.3の問題設定面白いね。

§15 確率過程の基礎

丁寧に読めばわかるけど、ちゃんと数学的に納得しようとすると割とむずい。
色々言ってるけど問題解くのに使いそうな結果は割と直観的な気がする。
複合ポアソン過程、例題の問15.2の解き筋を見るに、例2の結果は覚えちゃったほうがいいかしら。

§16 重回帰分析

線形代数をすべて忘れたので議論についていけずに死ぬ。見覚えはある。
例題見る限り、定性的に雰囲気を理解しておけば十分な気がする。
30章で出てくるはずのAICを使わされる例題があった。

§17 回帰診断法

ここは軽い読み物くらいの感覚。

§18 質的回帰

解析的に解けない話になってくるので、問題を解くのはむしろ楽そう。

§19 回帰分析その他

トービットモデル、用語は初めて聞いたけど内容は難しくない。
比例ハザードモデルのくだり、マジで何言ってるかわからないので諦めた。

§20 分散分析と実験計画法

やり方を覚えれば問題は解けるが……という感じ。
理論を追うのは諦め。特に直交表のくだり。本当に結果とやり方しか書いてない。

§21 標本調査法

難しくない。
標本平均の分散の有限調整項のくだりは導出もなくいきなり出てきたけど、問21.3を見る限り使う場合は問題文で与えてくれるポリシーなのかな。

§22 主成分分析

まぁわかります。
このあたり、もう難しい問題は出しようがないと思うので舐めてる。

§23 判別分析

サポートベクターマシン、懐かしい。
問23.3はわかってない。

§24 クラスター分析

ここはわかりやすい。
ウォード法、とか初めて聞いた。

§25 因子分析・グラフィカルモデル

因子分析、本質的にやりたいこと主成分分析とほぼ同じなように見えてる。
グラフィカルモデル、雰囲気しかわからない。

§26 その他の多変量解析手法

「その他」って言ってる時点で重要じゃないだろうっていう気持ちで流し読み。

§27 時系列解析

長い。むずい。

§28 分割表

長い。流し読み。

§29 不完全データの統計処理

定性的にはわかる。

§30 モデル選択

AICとBIC。導出とか理論背景は省略されている。
重回帰分析でのそれぞれの求め方は要暗記か?

§31 ベイズ法

前半は割と理解しやすい。
後半は何もわからない。

§32 シミュレーション

もう読む気力がない。
πの推定ができればいいですか?

試験

過去問

この時点で本番まで2日くらいしかなかったので、ラストの詰め込みで2015年~2019年までの論述以外を1周。
基礎的な理解がおおよそできていれば8割位はとれそう、といった感触。
確率分布の定義式とか前提になる数式とかは結構問題文で与えてくれる事が多いので、ガリガリ暗記頑張らないといけない、という感じではなさそうで安心。
2021年分は難しすぎとの噂だったけど本当にそうだったので、やりかけて3問くらいで投げた。実際やらなくてよかったと思う。

本番

テストセンターの受付で電卓を忘れたことが発覚し、近くのコンビニにダッシュで買いに行ってなんとか受験させてもらったものの、コンビニに唯一あったルート計算のできないちっちゃい電卓で解かないといけない縛りプレイに。
ただ定性的な問題も割と多いのと、ルート計算が必要なのは2問くらい(ゴリ押しでがんばった)だったのでなんとかなった。
過去問の傾向と割と近く、細かい暗記や複雑な計算というよりもきちんと基礎を理解していれば6割は超えそう、くらいの難易度に感じた。
結果、直前の詰め込みが効いて、あんまりスコア高くはなかったもののなんとか合格。

感想

準1級、高度な数学的内容をカバーしつつ、実問題への適用に重きを置いた作問がされていて、統計学が如何に世の中で役立てられているかということを強く感じられる試験で良いものでした。
学生時代に基礎的な統計の勉強をしたことはあるとはいえ、応用的な内容は知らないこともたくさんあった。
細かい理論展開まで追ってしっかり理解できたかというと全然(「完全に理解した」状態)だけど、概形は掴めたのである程度目標は達成できた気持ち。
久しぶりに数学に触れて楽しさよりもしんどさのほうがやや上回っていたことに加齢を感じる。
1級はまた気が向いたらかな。

この記事が気に入ったらサポートをしてみませんか?