統計検定準1級ギリギリ合格体験記〜安定合格したい人へ〜

はじめに

2024/9/7、統計検定準1級に合格しました。
二週間前に一度51点で受け、今回は61点ととんでもないギリギリ合格でした。
受かったあとは色々な方の勉強にお世話になったので後続のために体験記を書こうと思っていたのですが、「こうすれば合格できるぞ!」とは言えず…ので、「こういう勉強しているとギリギリだから別途こういうのやっといたほうがいい」ということを伝えたいと思います。優秀な人と比べて試験の情報量も倍ありますし。


受けようと思ったきっかけ

そもそも私は人類学に興味があって、そこら辺を読み漁っていました。最近でも人類学はビジネスの分野でも使われるようになってこそいますがまだまだ「あやしい」「n=1じゃん」「使えない学問」のイメージはあると思います。そこでLLMも現れてきた昨今、データ分析や機械学習と人類学って掛け合わせできるんじゃねと思い、機械学習の勉強を決意。しかし基礎知識の弱さにより、SVMの実装あたりでバタンキュー。こりゃ基礎体力つけねばならんということで、検定を受けようと思いました。

実際にした勉強方法

学歴

学歴は理系とはいえ生物系、ぶっちゃけかなり数学は弱い状態でした。
統計の授業もあってF分布までしっかりやったはずなんですが…勉強を始めた時は正規分布すらまともに意味がわかっていませんでした。
幸い大学レベルの微分積分や行列は覚えており、部分積分や行列の積ぐらいは大丈夫な状態でした。

[スタート〜3週]2級範囲の復習

まずは2級の範囲、基礎の基礎から固めねばということで、『基礎から学ぶ統計学』を一通りやりました。この本のカバー範囲は確率、各分布、単回帰分析の基礎ですが、これがとても素晴らしく、図が多いです。分布について直感的に理解できない方はおすすめです。

あとはランニングマシーンに乗りながら「とけたろうチャンネル」の統計検定2級講座を2周しました。

これが終わったら赤本と言われる『統計学入門』をパラパラと。でもあんまり参考にしてないかな…「2級には難しく、準1級には通じない」と言われたりしている子です。とりあえず2周、関連のありそうな問題を解きました。

ここまでで大体3週間くらいです。

[3週〜8週]ワークブック実践

皆が皆言っている通り、最初っからわけわからんです。勉強の指針も立てづらかったです。

ただこの合格体験記のおかげで各章の難易度の感触が掴め、安心感がありました。

1周目はまず単語勉強です。わからない単語をChatGPTに聞き、ipynb形式で例とあわせて保存していきました。ぶっちゃけ振り返りしてないから、今ならNotionに保存して理解度とかつけていくかな…
全くわからんものはとりあえずわからないままにしています。

2周目は問題解き始めています。ここもとりあえずわからない問題は飛ばしていました。以下の再生リストをなぞりながらやってました。この再生リストは試験日までDLし、ランニング時にはずっと聞いていました。

ここら辺から「あれ、明らかに数学力足りないな?」と気づき、特に線形代数の動画のこちらを見て勉強してました。これらもほぼランニング中。大学の教科書は参考にならんかった。
これらを見ると「対称行列は直行行列で対角化できる」がわかるようになります。なお特異値分解は捨てました(涙)。

3周目あたりから、全く理解できないところに付箋をつけ、再度調査段階に入りました。ただ結局詰めは甘く、行列だけの数式とかは若干飛ばし気味…
ここら辺から周回数は数えず、章ごとに理解できないところをつまみながら読み始めてます。

[8週〜12週]過去問

2015から2021年に向かうように、2年やったら間違った問題振り返り…とやってきました。
結局今でも2021年問題はわからない…
たまにWBに戻りながらも、3周ほど問題を解きました。

[12週〜14週(1回目試験まで)]

ネットの記事に過学習をするな!とは言われたものの、曖昧な部分を埋めるためにWBと過去問を繰り返し解き直す日々…だって他に何をすればいいか分からずに…とりあえず同等の問題出たら8割は取れるだろ〜と思ったら、不合格。

[12週〜16週(2回目試験合格まで)]

後述する問題傾向をもとに、勉強をしていました。でも1回目までの試験ほどがっつかず、ひとつひとつ、指差し確認していく作業です。この段階でWBに下線を引きました笑

反省と振り返り

総勉強時間は400時間超えたと思います。ただし問題に向き合った時間だけでなく、ランニングしながら動画見てた時間も含めてです。まあ2級と準1級の勉強時間合わせたら大体そのぐらい…かもしれません。

試験難易度

私が受けた試験はCBTなってから変わらずの「202107版」でした。
難易度としては2021>CBT≧2019>otherと、他の人と同じ所感です。

計算問題の出し方や選択式も似ている部分はあったものの、「こんなこと聞くん!?」って驚きは2回ともありました。

終わったあとどれぐらいの知識がついていたか

WBに書いてある内容は網羅したので、知識としてはついていると自信を持って言えます。

しかしその反面、次元削減や主成分分析まわりについての線形代数の知識は「そういうもんなんだな〜」くらいで止まっています。ラグランジュとか、漸近性とか、大数の弱法則とか、数学的な理解というより意味がわかる、程度におさまっています。

なぜ点数がギリギリになったのか?

2回の試験を受けてどっちにも通じたことは理解の深さです。先人が過学習するなと言っていた理由はここにあると思います。
確かにWBを読めば解けると言えば解ける。しかし本当に1行書いてることを出してきます。ましてや超基礎的なところを「なぜそんな統計方法をとったし」とつっこみたくなるようなものまであります。平均について、10行
どうしても問題を重視したり、WBの内容や解き方などを勉強してしまうと理解が深くなりません。

どうすれば80点狙える?

61点というギリチョンを出してしまった私ですが、ここまで受けて「実際こうすれば完璧にわかるだろうな」という直感があります。それは次の通りです。

  • 問題の解説を深読みする

  • 実践をする

  • 1級と2級の勉強をする

問題の深読み
例えば過去問の解説はとても貴重です。なんで間違っているかというのが、実はWBにほぼ書いてなかったりしてます。問題も限られている中、こういうところから勉強を深めることが大事です。実際2回目の試験前にやっていたのはこれです。

実践をする
特に私は本末転倒だと思いました。SVMの意味がわからなかったのに、結局実際のコードに落とさず、頭だけの知識で挑んでいます。これではそもそも何のために勉強していたんだと。
これをPythonとかで実装していれば「どの数字が大きく影響を与えるか」「どういうデータを処理できるのか」などがわかってたはず、例えば29章の値の補完で過大評価するとか影響するとかの問題になんなく対応できたはずです。

1級と2級の勉強をする
…は?と思うかもしれませんが、これはマジです。
2級の勉強してから準1級の勉強したほうがいいと言っている方が多いですし、わざわざ2級の過去問買っている人までいます。その勉強法は正しくてCBT出題範囲の4割くらい2級でも解けたと思います。しかし私はその練度が低い状態で準1級に挑んでしまいました。
この時点で若干のディスアドバンテージ。実際「確率と確率分布」の項では正答率40%と基礎の弱さが伺えます。
じゃあ1級はどうしてか。それはWBに書かれている1行を追うのは明らかに非効率だということです。やはりWBは1冊の本に収めるということでかなり情報が削がれており、しかしギリギリ類推できる問題を出してきます。それを頑張るよりかは、もっと上位の勉強をしたほうがいいです。
なので「準1級のステップのために2級を勉強する」に加えて、「1級のステップのために準1級を勉強する」的なノリで、そこまで視野を持って勉強したほうがいいです。

この勉強のおすすめポイントと欠点

今回私は準1級だけ勉強、合格しましたが、1度落ちた上1級へのモチベーションはありません笑。それはやはり深い部分を勉強せずに合格しようと思ったからだと思います。

しかしこの勉強方法は2級→準1級→1級につながるため、段階的に資格が取れて外向けも良いです。実践も兼ねているので刺激も多いと思います。
また実践も合わせるので私みたいに勉強ばっかで他のことに手がつかないなんてこともなくなります。

難点は時間がかかりすぎること、金がかかることです。勉強は1年かかるかもしれません。ちなみに2回目落ちたら半年空けて受けようと思ってました。WBや過去問の他にも色々買うことになると思います。
でも「統計の知識を得て活かす」ということであれば、この方法が本来的なのではないでしょうか。

終わりに

とりあえず統計検定の勉強を通して、モノの見方が変わったことは間違い無いです。また、半端な知識だときちんと落としてくれる、良問だったと思います。

この文章が統計検定を受ける人の助けになってくれると嬉しいです。
浅い勉強だと合格もギリギリで実践も疎かか
深く勉強するということことで検定合格率は上がるし、実践にも活かせるか

あきらか後者の勉強が良いです。本質大事。それを分からせてくれるのが準1級でした。


いただいたサポートは健康のさらなる研究に役立たせていただきます。