見出し画像

統計検定準1級 合格体験記


1.はじめに

2024年5月18日に統計検定準1級に合格しました。参考書はもちろん多くの記事や動画にお世話になったので、私の勉強法なども纏めておきます。本記事が同資格を受験する方のお役に立てば幸甚です。

2.自己紹介

IT業界で20年ほど働いています。プログラミングやデータベース、セキュリティなど、色々な業務に携わってきました。得意技はSQLです。数年前に「データサイエンティスト」という言葉が脚光?を浴びて以来、統計の勉強をしてみようかなーと思いながら数年が経っていました。

2023年11月に重い腰を上げ2級の勉強を始め、3ヶ月後の2024年2月に2級に合格しました。微分積分は高校の時になんとなくやったなーというレベルです。

3.試験勉強について

2級に合格してから1週間後に準1級の勉強を始め、約3か月後に合格しました。勉強時間は300時間ぐらいだったと思います。(平均すると、平日は約3時間、土日祝は約4時間)

準1級の勉強といえばもちろんワークブック(以下WB)。初見は多くの皆さんと同じかもしれませんが全く理解できず、「この人は一体何を言ってるんだろう」「前提知識がおかしくない?」と言いながら読み始めました。

昔ならこの時点で諦めて試合終了だったと思いますが、時代は令和。勉強方法も変わってきていることを実感しました。

たくさんの有識者の方々が関連する動画や記事を作成されていて、このWBの行間を埋めてくれます。おかげでなんとか継続して勉強することができました。

勉強法としては、基本的にこのWBを周回していくことになります。

■1周目:本文にはあまり拘らず、例題を解いていきました。後述しますが、「Yuya Kawaguchi」さんのYouTubeで解説動画を視聴してから解くのが最善です。(※全ての例題の解説動画があるわけではありません)

■2周目:再度例題を解きつつ、本文もある程度理解しながら進めました。ここでは「解法メモ」と「要点メモ」を作成していきました。

「解法メモ」は例題の計算過程を省略せず、後で読み返しても理解できるように作成しました。

「要点メモ」は暗記用として作成しました。

■3周目:再度例題を解きつつ、苦手分野を中心に勉強。「要点メモ」も更新していきました。過去問にも取り組みつつ、2級の過去問の復習もここで行いました。

こんな感じで最終的にはWBを3周したのですが、これとは別に勉強ルーティンも紹介します。

◎朝ルーティン:1周目の時は前日に勉強した内容を思い出しながら、2周目以降は「要点メモ」の内容をブツブツつぶやきながら30分ほど朝散歩をしてました。

思い出せないときは立ち止まって「要点メモ」を取り出しては思い出す、というのを繰り返し、この「要点メモ」を記憶するようにしてました。

◎昼ルーティン:WBを持ち歩きながら30分ほど食後の散歩をしてました。すんなり頭に入ってこない章を中心にちょっと読んでは歩いて、ちょっと読んでは歩いてを繰り返して、慣れるようにしてました。

◎夜ルーティン:仕事の後に2時間ほど勉強をしてました。動画を見たり、例題やったり、検索したり、色々ですね。

◎休日ルーティン:休日は午前中にカフェで約2時間勉強して、お昼を食べたら本屋の統計コーナーをぶらぶらして、ジムで汗を流して、また違うカフェで約2時間勉強する、というような感じで過ごしていました。

4.参考にした書籍、動画、記事

4-1.書籍

■入門 統計学
2級の時にもお世話になったテキストです。2級の範囲を超えた内容を載っているので、準1級の勉強でも使えます。2級の時にこの本で勉強した方は引き続き参考になると思います。

※書籍については他にあと2冊購入したのですが(多変量解析とベイズ統計学)、結果的に買わなくてよかったかなと思うこともあり、ここでは割愛します。

4-2.動画

■「Yuya Kawaguchi」さんのYouTubeチャンネル
合格体験記の中で紹介されている方も多いですが、私もその中の1人です。勉強法のところでも書きましたが、まずはWBの例題を解く前に解説動画を見るのが最善です。もちろん他にも参考になる動画がたくさんあります。

■「進捗卍チャンネル」さんのYouTube
あまり紹介されている方はいないかもしれませんが、とても参考になりました。特にWBの「第8章 統計的推定の基礎」と「第15章 確率過程の基礎」は結構絶望的だったので助かりました。

■「田中嘉博」さんのYouTubeチャンネル
概要をザックリ理解したい時に重宝しました。優しい口調です。「P値って何だっけ」「統計学って何だっけ」みたいな時に基本に戻ることもできました。

■「データサイエンスLab.」さんのYouTubeチャンネル
「主成分分析」や「判別分析」など主に多変量解析分野で参考になりました。何度も聞いていると機械音のような音声が癖になります…

■「はじめての統計学」さんのYouTubeチャンネル
「フィッシャー情報量」や「中心極限定理」などで参考になりました。1級の範囲も含まれてそうなので深追いはしませんでしたが。各動画コンパクトに纏まっていて視聴しやすいです。

4-3.記事

■「えびかずき」さんのnote
参考にされている方も多いと思います。手書きの説明で、どういう過程で計算されているのかとても参考になりました。

■「とけたろうブログ」さんの記事
2級の時から各動画やチートシートにはお世話になりました。準1級のチートシートは試験前の最終チェックとして活用しました。2級と違っていきなり準1級のチートシートにはいかない方がいいと思います。

以上、参考となった書籍、動画、記事を紹介させていただきました。もちろんここで紹介したのが全てではなく、理解が足りない場合はその都度他のコンテンツを参照していきました。

ここで大事なことを1つだけ。

WBの行間を埋めるために他のいろいろなコンテンツを参考にすると思いますが、最後はWBに返ってくることをおススメします。どういうことかというと、公式や数式はいろんな書き方があり、同じことが書かれていてもぱっと見で同じことだと分からないことがあります。

試験問題はWBの記載が基本になると思いますので、試験対策としてはあくまでもWBの書き方に慣れることが重要だと考えます。

5.試験について

試験についてはWB2週目が終わった段階で早めに日程を決めて予約しましょう。場所にもよると思いますが、1ヶ月前ぐらいに予約するのがいいと思います。私は2級の時と同じ会場にしました。

予定時刻の10分前に会場に到着。部屋に入ると簡単な説明があり、メモ用紙2枚とボールペン2本、正規分布やt分布の付表が1枚渡されます。ボールペンのインク切れがないか確認し、メモ用紙を交換したい場合などの手順などを質問します。持ち物は電卓のみです。

開始ボタンをクリックすると試験開始です。自分のタイミングで開始できます。30秒ほど深呼吸して開始ボタンをクリックし、まずはどんな問題が出てるのか見ていきます。

「ほう、この問題か」「この章捨てなくてよかった」「やっぱりこの問題でるのね」などなど思いながら最後まで見ていきました。難しそうな問題と計算に時間がかかりそうな問題をチェックし、いざ解答へ!

と思ったのですが、最初の問題でいきなりつまずいてしまい、しばらくはドキドキが止まりませんでした。数問解けたころにようやく落ち着いてきて、「いける、いける」と心の中でつぶやきながら進めていきました。

残り時間を見ながら「意外といけるかも?」という思いがよぎります。そんな感じで余裕かましていたら、最後は時間が足りなくなり2問適当に解答することになってしまいました…。

ということで結果発表へ。アンケートに答えてクリックすると「合格」の文字が!

試験結果レポート

3ヶ月間集中して勉強してきたので達成感が凄かったです。ルーティンからの解放、次何やろうかなー、など次々に頭をよぎります。

私にとってはかなり難しい試験だったので、他に代えがたい達成感を得ることができました。仕事に直接関連するかは分かりませんが、この経験と知識を今後に活かしていこうと思います。

6.ワークブック各章ごとの感想

個別の内容は後日別記事に纏めていこうと思いますが、ここでは各章ごとの感想や試験対策として捨てた項目などを簡単に紹介します。個人差はあると思いますが、難易度を★で付けましたのでご参考まで。

★★★(ちょっと何言ってるのか分からない…)
★★(よく分からないがイメージはできる)
★(まあ言っていることは分かる)

■第1章 事象と確率
難易度★★

確率には昔から苦手意識があり苦戦しました。それでも「ベイズの定理」を理解できればなんとかなると思います。

余談ですが、本章の最後に期待値と分散を積分で求める公式が出てきます。これを最終章である第32章の例題で使うのですが、なんかいろいろ繋がってぞわっとしました…

■第2章 確率分布と母関数
難易度:★★★

1つ目の高難易度の章です。2級を突破された方が最初にぶつかる壁が「モーメント母関数」だと思います。計算が手ごわく、何度計算しても計算が合わないこと…。

そして「同時確率関数」も意外と手ごわいです。なんとなくの理解だとちょっと厳しいです。生存関数は第19章でも出てくるのでここではスルーしました。

■第3章 分布の特性値
難易度:★

ほぼ2級の範囲の範囲だと思います。復習も兼ねてほっと一息でしょうか。「分散共分散行列」はここではいったんスルーしました。

■第4章 変数変換
難易度:★★★

第2章に続いて、2つ目の高難易度の章です。全部で4ページという少ない分量ですが破壊力抜群です。1変数と2変数の場合でそれぞれ理解する必要があります。「ヤコビアン」はまあそういうものとして理解しました。

■第5章 離散型分布
難易度:★

2級+αの章です。「確率母関数」は最初計算で導出しましたが、結局暗記することになりました。それでも何度か計算で導出しておいた方がいいかと思います。

また、「再生性」や「無記憶性」などの分布の性質を理解する必要があります。

「多項分布」はWBの説明が難解なため、別記事で理解を深めました。(サイコロ投げの例がよく出てきます)

■第6章 連続型分布と標本分布
難易度:★

第5章と同じく、2級+αの章です。「ガンマ分布」と「ベータ分布」は第31章の「ベイズ法」でやるときに一緒に理解しました。

「2変量正規分布」と「混合正規分布」も第31章の例題で出てくるので、そこでイメージを膨らませました。

■第7章 極限定理、漸近理論
難易度:★★

正確には理解できないが、なんとなくイメージはできるという章です。「中心極限定理」や「大数の弱法則」は別動画で理解を深めました。「連続写像定理」は最後まで何を言ってるのか分かりませんでした…

■第8章 統計的推定の基礎
難易度:★★★

第4章に続いて、3つ目の高難易度の章です。各用語の意味や「最尤法」、「点推定の性質」「漸近的な性質」など難解で、さらにはリサンプリング法もあり盛りだくさんです。

初見ではもちろん理解できず、勉強の最後の方になんとなく理解できた感じです。前述した「進捗卍チャンネル」さんの動画が秀逸で、その動画を見ながら一時停止してはノートに写して…を繰り返して、ようやくモノになった感じです。

「推定量とは何なのか」「不偏推定量とは何なのか」「何をもって不偏推定量なのか」などの理解が必要です。

■第9章 区間推定
難易度:★

2級の復習も兼ねてほっと一息の章です。新たに覚えるのは「多項分布の差の信頼区間」ぐらいでしょうか。

■第10章 検定の基礎と検定法の導出
難易度:★

2級の復習も兼ねてほっと一息の章です。新たに覚えるのは「抜取検査」ぐらいでしょうか。

■第11章 正規分布に関する検定
難易度:★

2級の復習も兼ねてほっと一息の章です。新たに覚えることはないかもしれません。

■第12章 一般の分布に関する検定法
難易度:★★

「ポアソン分布に関する検定」と「尤度比検定」が新しい内容です。特に「尤度比検定」については最初イメージが難しく、勉強の最後の方になって、あーこういうことなのかなといった感じでした…

■第13章 ノンパラメトリック法
難易度:★

検定内容と検定法、結果の判定方法を覚えるのが大変な章です。「この公式のここが6で、こっちが24で、こっちは12で…」みたいな感じで検定統計量の公式を覚えるのが結構大変だが、そこまで複雑ではありません。語呂合わせでもなんでもいいので覚えていきましょう。

■第14章 マルコフ連鎖
難易度:★

初見ではなんとなく難しそうに感じますがそうでもない章です。実際に手を動かして図を書いて落ち着いて解けばなんとかなります。覚えることは少ないので計算ミスをしないようにしたいです。

■第15章 確率過程の基礎
難易度:★★★

第8章に続いて、4つ目の高難易度の章です。正直最初の一文から何を言っているのか分からない…。

こちらも前述の「進捗卍チャンネル」さんの解説動画が秀逸です。この章は「捨てる」覚悟もしましたが、最終的には捨てませんでした。例題の類似問題が試験に出たらギリギリ解けるレベルに持っていった感じです。

■第16章 重回帰分析
難易度:★★

この章から回帰分析が始まります。どこまで覚えればいいのか迷った章で、例題が解けるレベルであれば正直「正規方程式」の理解はいらないような気もしますが、それでは本質から逃げているような感じもしました。

とはいえ正確に理解しようとするとかなりの時間を要すると思われたので、いったん「総変動」「回帰変動」「残差変動」を図でイメージできるように理解するに留めました。

最終的に「正規方程式」は覚えたのですが、試験でどのような問われ方がするのか最後までイメージできず…。「正則化」については別動画で理解を深めました。

■第17章 回帰診断法
難易度:★

「残差とは何なのか」を理解する章かと思います。各種グラフの読み方を、例題を中心に理解しました。「自己相関(系列相関)とDW比」は第27章までスルーしました。

■第18章 質的回帰
難易度:★★

内容的には割と難しい方だと思いますが、本文と例題を繰り返してなんとか理解できるレベルまでもっていきました。途中で、「ロジット変換」と「ロジスティックス変換」を行き来できるようになってスッキリしたのを覚えています。

「オッズ」「オッズ比」、「限界効果」などしっくりこない項目も多いですが、やはり繰り返し例題を解くことで理解を深めました。

■第19章 回帰分析その他
難易度:★★

「トービットモデル」と「生存時間解析」の2つがメインの章です。「トービットモデル」は尤度関数とグラフのイメージを理解しました。

「生存時間解析」は「Yuya Kawaguchi」さんのYouTubeが秀逸で、まずはグラフを書いて、「F(t) + S(t) = 1」と置いて、そこから期待値を求めたり確率密度関数を求めたり、とにかく反復して理解しました。

例題の「カプラン・マイヤー推定量」のグラフが対数をとっていて、他の関連動画ではほとんど対応とってなくて、どっちが通常使われるんだろうとモヤモヤしてました。

■第20章 分散分析と実験計画法
難易度:★★

「2元配置」から新しい内容ですね。「乱塊法」「直交表」「交絡」などは別動画で理解を深めました。振り返ってみればそんなに難解ではなかったかも…

■第21章 標本調査法
難易度:★

2級の復習も兼ねてほっと一息の章です。新たに覚えるのは「非復元抽出」と「層化抽出法」ぐらいでしょうか。

■第22章 主成分分析
難易度:★★

この章から多変量解析が始まります。重回帰分析同様、どこまで覚えればいいのか迷う章でした。

いったんは「主成分」「固有値」「固有ベクトル」「寄与率」「累積寄与率」「主成分負荷量」の関連性を理解して、分析結果の理解を優先しました。途中で「主成分得点」を計算してみたのですが、なかなか計算結果が合わず、分かった時はかなりスッキリしました。

固有値計算は簡単なレベルに留め、「特異値分解」と「自己符号化器」は捨てました…

■第23章 判別分析
難易度:★★

こちらもどこまで覚えればいいのか迷う章です。いったん分析の具体的なイメージと分析結果の理解を優先しました。「線形判別関数」は最後の最後で一応覚えましたが、理解までは遠かったような気がします。

「SVM」はなんとなーくな理解に留め、「混同行列」と「ROC曲線」については別動画で理解を深めました。

■第24章 クラスター分析
難易度:★

割と分かりやすい章ですが、「K-means」の計算がとにかく大変でした。試験で出たら最後に回そうと思いながら問題解いてました。

■第25章 因子分析・グラフィカルモデル
難易度:★★

「主成分分析」と似たような感じですが、こちらの方が理解しやすいかもです。構造方程式やグラフィカルモデルは別動画で理解を深めました。操作変数法の計算が合わずかなり苦労しました。

■第26章 その他の多変量解析
難易度:★★

この章は捨てるか迷いましたが、結果捨てなくてよかったです。「軽量MDS」の計算が結構複雑ですが、こちらも「進捗卍チャンネル」さんの動画が参考になります。また、別動画で「余因子展開」を習得すると計算が楽になります。

「正準相関分析」「数量化法」「対応分析」は特徴を抑えるに留めました。

■第27章 時系列解析
難易度:★★★

第15章に続いて、5つ目の高難易度の章です。初見ではさっぱり分からず、まずは別動画でザックリ理解しました。繰り返しWBを読むことで、計算式やグラフについて少しずつ理解できるようなりました。

共分散の計算は若干面倒でしたが、意味が分かればそこまで難しくない印象です。「スペクトラム」の本質は分からず、概要とグラフの見方の理解に留めました。「DW比」と「残差」の関連はしっかり理解しました。

■第28章 分割表
難易度:★★

同じようなことが何度も書かれているような気がする章ですが、覚えることは割と明確です。逸脱度の計算がなかなか合わず苦労しました。(logの計算ができなかっただけという…)

WB本文を理解するよりは例題をスムーズに解けることに注力しました。グラフィカルモデルは第25章でも出てきますが、別動画で理解を深めました。

■第29章 不完全データの統計処理
難易度:★★

「MCAR」「MAR」「MNAR」の概要を理解することから始めました。理解してしまえば「まあ、そうだよね」という感じです。「EMアルゴリズム」は何度読んでも理解できず、過去問の解説でなんとなく理解しました。

■第30章 モデル選択
難易度:★

「AIC」と「BIC」の公式を反復して暗記しました。こっちがパラメータ数で、こっちが説明変数の数で、みたいな。「クロスバリデーション」「過学習」は第16章とも関連して理解しました。

■第31章 ベイズ法
難易度:★★★

第27章に続いて、6つ目の高難易度の章です。実はベイズ法に特化した参考書を1冊購入したのですが、あまり役に立ちませんでした。関連する別動画を視聴しつつ、WB本文と例で理解を深めました。

ベイズ法の計算自体は例題まで解けてしまえばあまり恐れることはない印象です。第6章で出てきた「ガンマ分布」と「ベータ分布」はここで理解しました。

「MHアルゴリズム」と「ギブス・サンプリング」などは理解が難しかったです。

■第32章 シミュレーション
難易度:★★★

第31章に続いて、7つ目の高難易度の章で、得意な人と不得意な人が分かれそうです。(私は不得意)

「モンテカルロ法」と「逆関数法」だけなんとか理解しましたが、「採択・棄却法」と「モンテカルロ積分」は捨てました。「ジャックナイフ法」と「ブートストラップ法」も完全理解までは遠かった感じです。

■まとめ
あくまでも個人的な意見ですが、以下のような難易度でした。
★★★(2, 4, 8, 15, 27, 31, 32の7個)
★★(1, 7, 12, 16, 18, 19, 20, 22, 23, 25, 26, 28, 29の13個)
★(3, 5, 6, 9, 10, 11, 13, 14, 17, 21, 24, 30の12個)

勉強していくポイントとしては理解できない章に時間をかけすぎないことでしょうか。もちろん最終的には「捨てる」と決めた内容以外は理解する必要がありますが…。

ちなみに私の場合最後まで残ったのが「第4章 変数変換」「第8章 統計的推定の基礎」「第15章 確率過程の基礎」の3つでした。

7.おわりに

統計検定1級には進まないことを決めたので、これから統計検定準1級の記事を何回かに分けて書いていこうと思います。少しでも同資格を受験する方のお役に立てば幸甚です。

この記事が気に入ったらサポートをしてみませんか?