見出し画像

統計検定 2級 & 準1級 合格記

初めまして.
今年から統計を勉強しはじめて、統計検定2級と準1級に合格しているので,合格記を書きます.



略歴とバックグラウンド

  • 現在29歳

  • 高校は田舎の自称進学校で,数IIICはしっかり勉強

  • 某旧帝大工学部・院卒(材料工学・非データサイエンス)

    • 微分積分学や線形代数学はほんのちょっとやっただけの素人.院試の時に基礎は3ヶ月くらいみっちり詰め込んだが,ほぼ全て忘れている.(ヤコビアンや固有値の求め方をおぼろげに記憶していた程度)

    • 研究も化学系・実験系だったので,数式や統計には全く触れず,よくわからずに申し訳程度にエラーバーだけ書く程度

  • メーカーで研究開発職に従事(非データサイエンス)

    • 入社時の研修で,申し訳程度に品質工学を履修.
      (標準偏差・母集団と標本の違い・工程能力指数・QC7つ道具の概要)

    • 研究の詳細は話せないが,表面粗さや接触などをテーマにしている.2年前くらいからPythonに興味を持ち,実験装置をプログラムで制御してデータを吸い上げて解析する流れを一気通貫で自動化するのにハマっている.

    • 2024/2 に趣味で基本情報技術者を取得.


なぜ統計検定?

大きく分けて理由が4つ.

  1. 自身のデータ分析スキルに限界を感じ,知識が必要だと感じたため.
    ここ数年のChatGPTをはじめとした生成AIの助けもあって.素人でもやりたいことを実現するコードはとりあえず書けるようになった.しかし,圧倒的に引き出しが少ない上に,ChatGPTが出力するコードに対して良し悪しの判断ができないことが問題と感じていた.体系的なデータ分析・解釈のスキルを身に付けたいと感じたので,受験を決意した.

  2. 興味本位
    普段の生活や実験業務などではデータの中身や意味に着目しがちだが,取られたデータ自身のばらつきが持っている性質やデータ分析の仕方,データ取得の作法まで,そういったメタ的なところが学問として体系化されている点に面白さを感じたため.fundamentalで教養的な知識なので,使える幅が広そうな点も魅力.

  3. データアナリストの妻の勧め
    そもそも統計検定自体を知ったのが妻が受けようとしていたから.
    妻は大学時代に統計のゼミを専攻していたり,業務で顧客データの分析を行っていたりするので,統計に詳しい.文系で数学はIIB止まりとのことで,数学は教え,統計は教えてもらいながら共に取り組んだ.(お互い負けず嫌いなので常にバチバチしがち)

  4. 20代最後の思い出作り
    これから体力と頭脳がどんどん衰えていくし,ライフスタイルもどんどん変わっていくと思うので.20代最後に,何かに全力を尽くすような経験をしたいと思っていた.統計検定は自分の脳力の限界にも挑めるし,今後のキャリアの助けになるようなスキルでもあると思うので,一番ベストだと思った.


受験のスケジュール

  • 2024/2/末 基本情報技術者取得,統計の勉強をスタート

  • 2024/3/22 統計検定2級合格
    やる気に満ち溢れていたので,2級受験前日にワークブックをポチり,
    合格日から準一級の勉強をスタート

2級合格レポート
  • 2024/5/26 統計検定準1級合格
    4月に新婚旅行に行っていたので,実質的な勉強期間は2ヶ月程度.トランジットのドバイで過去問を解いていたのはいい思い出.
    GW休暇を長めにもらえる会社ではあったので,そこで集中的に,毎日ドトールに引きこもって勉強した.合計勉強時間は150時間程度かな?記録していないのでわかりません.正直勉強時間よりも何をやってどれくらい理解したかの方が大事だと思うので…

準1級合格レポート 多変量もっと取りたかった
  • そして現在,1級に向けた勉強を進めている(申込済,応用は理工学).
    今が一番難しくてハードなので,正直心が折れそう(ぴえん)


使用教材 

統計検定2級

  • 統計学の時間 (難易度:★★☆☆☆,3月 上旬〜中旬)

導入〜2級の基礎固めに使用.言わずと知れたWeb名著
ボリューミーだが,Webならではで見やすくまとまっていてとても好き.
演習問題も適度な難易度なので,↓の過去問につながりやすい.

  • 2級公式問題集 (難易度:★★☆☆☆, 3月中旬〜下旬)

2級の演習に使用.難易度はCBTと比べて大差はない気がしたので,この演習量がものを言うと思う.出題形式の理解のために,とりあえず統計学の時間を一周した時点で解いてみるのがおすすめ.演習量を確保するために,書籍アプリhontoで購入できる,さらに過去の問題集もやったのはここだけの話.

  • とけたろうチートシート2級 (難易度:★★☆☆☆,3月下旬)

試験前に何度も繰り返し読んだ.正直出題範囲を過不足なくまとめていると思うので,これが全て人に説明できるほど理解できたら,とけたろう先生の言う通り,満点を取れると思う.

統計検定準1級

  • とけたろうチートシート準1級 (難易度:★★★☆☆,4月上旬〜5月下旬)

正直な話,準1級のワークブックは範囲が広すぎるので,これがないと心が折れていたと思う.ワークブックが抽象的に難しく説明しているものも,具体的に,簡潔に,体系的にまとめてくれているので本当に参考になる.印刷して,思考の過程を都度メモしたり,毎日の通勤で確認していたりしたのでボロボロになっている.1週目はチートシートベースに概念をさっくり理解するところから始めないと,全体像がわからずに詰む.先達はあらまほしきことなり.ちなみに,とけたろう先生のXで統計検定準1級通信と題して,各トピックをまとめているのでそちらも必見.


  • 統計学実践ワークブック (難易度:★★★★☆,時期 4月上旬〜)

ネット上でいろんな人が言っている通り,範囲が広すぎる上にそれぞれコンパクトにまとまりすぎてて行間がはしょられすぎているが,正直この分量でまとめようと思ったらこうするしかないと思う.日本統計学会の苦労が窺える.目次の長さを見て絶句したのはいい思い出だが,最終的には,何章のどこに何が書いてあったか,と言うレベルまで頭に入れた.

  • 準1級 公式問題集(難易度:★★★★☆,(論述は5),時期 4月上旬〜)

「過去問への過適合では統計検定は受からない」とよく言われているが,個人的にはワークブックと同じくらいちゃんとやった方がいいと思う.論述問題も含めて.その理由は,

  • 出題傾向がわかる(合格のために求められているレベルがわかる.)

  • 計算演習を積める.本番の緊張感で解ける

  • 論述問題は比較的理解しにくいテーマを扱っていたりするので,誘導問題を解いていくことで段階的に理解できる.

出題傾向が分かれば膨大な範囲のワークブックをどの程度まで理解しておけばいいかがわかるので,チートシート見ながらサッと一周して,そのあとすぐに取り組むのがおすすめ.


勉強方法

十人十色でやり方は異なると思うが,私のやり方は下記.

  • とりあえずパラパラ見るだけの1周をすぐに(1週間程度で)終える.
    2周目でそこそこ理解しようとじっくり読んで,3週目はわからなかったところ,読み飛ばしたところを重点的にやる.

    • 最初の一周はどんなことをやるのか俯瞰するイメージ.目次と照らし合わせながら読むと◎

    • 初見でわからないものがあっても,いろんな文献を参考にしながら2周,3周していくと(何故か)理解できるようになるので,その時が来るのを信じて少しずつ積んでいく.

    • 終盤は一通り知識が定着するので,1日で演習問題だけ1周したりもしていた.

    • 問題集もすぐにサッと1周すべき.求められているレベル感がわかる.同時に,ただ単に合格を目的とするのであれば,ワークブックの内容は過剰すぎると言うことに気づけるので,今度,どのレベルまでやっていけばいいのか,の見通しがつく.

  • 問題演習は必ず手を動かす.

    • 見るだけの勉強では絶対に当日計算ミスが発生するし,途中でペンが詰まるので意味がないと思っている.準1級では1級ほど計算量は要求されないが,それでも解法がすぐに浮かび,すらすら書き始められるようにするのは重要なので,日頃の演習量,計算の正確さがモノを言うと思う.
      普段の演習では自分が書きやすいと思う,気分が上がるペンと紙でやるのがおすすめ.私は自分が解いたものやノートなどを見返さないタイプでなので,オキナのプロジェクトペーパーを使っていた.計算に使った紙をためて置いて,後日キャンプで燃やしたのはいい思い出.最近は1級受験のために鉛筆を書ったが,木の匂いで受験生時代を思い出して集中できるのでとても良い.

  • いろんな文献を横断的に見て理解する.

    • ワークブックととけたろうのチートシートを軸に,ブログ記事,別の参考書,過去問の類題,ChatGPTなど活用した.1つの概念に関して多角的な記述を見ると理解につながるので良い.もちろん,ワークブック内でも一つの概念に関連する概念があればどんどん紐づけていくべき(例えば5章の超幾何分布の分散と21章の有限母集団修正など).

  • 丸暗記する量を減らす工夫

    • 丸暗記が苦手なので,何故そうなっているのかを結びつけて覚えたり,基本系と派生系を系統立てて整理して理解した.例えばカイ二乗分布と指数分布はどちらもガンマ分布の派生系で,ガンマ分布の期待値と分散から求まるし,再生性が使えるから確率密度関数 X+Y の分布みたいな形を聞かれても怖くない,的な(伝われ).

    • 用語についてはアルファベットの略称がとても多いので,それらは略さずに意味を英語から理解して覚えた.略語を見たら正式名称に直して,単語1つずつの意味を拾っていく.(これは情報系の勉強でめちゃくちゃ役に立つやり方.) i.i.d.,MLE,UMVUE,BLUE,MNAR,MAR,SVM,TN,FP,EMアルゴリズム,ROCとAUCなど

    • それでもどうしようもない,理解して覚えるだけの時間がないところは丸暗記して試験に臨んだ.


当日・本番の注意点

  • 会場選びがめちゃくちゃに大事.

    • CBTでいろんなところで受験できるが,ネット上の情報によると,パソコン教室で話し声がうるさい,ホワイトボードと太いペンを筆記用に渡されて全然上手く描けない,と言うような会場もよく聞くので,しっかりとしたテストセンターでの受験がおすすめ.冗談抜きで10点近く点数が変わると思う.

    • 私は2級・準1級ともにオデッセイ テスティングセンター 横浜店で受験した.ちゃんと紙とボールペンで試験できるので良い.ちょっと薄暗いけど.試験会場の様子がYoutubeにアップロードされているので,イメージトレーニングにどうぞ.

  • 仕様の把握.問題ページを最後まで送ったあと,リストで全問表示されるので,とりあえず少しでも悩んだ問題は後で解くにチェックを入れて,リスト形式になった後に解けるものから考えていった方がいい.

    • 初めて2級を受けた時には仕様がわからずに大変戸惑った.最後の問題で次へ押したら採点されるんじゃないかとヒヤヒヤした.仕様を事前に把握しておくことが大事.(一昔前のUI,一昔前のフォントの感じが非常に風情があって好き)

  • 焦らずに解いて,見直しは何回でもするべき

    • 当日特有の緊張感によるテンパリからか,2~3問の計算ミスが発覚したので,何回でも解き直し,見直しをするのが良いと思う.
      多肢択一式なので,思考の過程を問われていないから,別解による解法で説いてみて確固たる根拠づけで自信に繋げたり,他の選択肢が何故違うのかを考えるのも◎

  • 合法ドーピング

    • テスト前ルーティーンで,レッド○ルの長缶丸飲みとぶどう糖補給でフル回転パフォーマンスに持っていく.当日夜は試験のアドレナリンとカフェインで絶対眠れなくなるが,気にしない.

  • 電卓を忘れない

    • 言わずもがな.超重要.


ワークブック感想&章ごとのまとめ

ながくなってしまったのでこちらの記事で.
15,000字にも及ぶ怪文書…お時間がある人だけどうぞ.



まとめ

今は統計検定1級のためにひたすら数理統計と戯れています.
もし合格して気が向いたときには合格記をアップロードします.

この記事が少しでも何かのお役に立てれば幸いです.

この記事が気に入ったらサポートをしてみませんか?