見出し画像

現役データサイエンティストが伝授!統計検定準1級取得への道

こんにちは。株式会社D4cプレミアムでデータサイエンティストをしている新卒2年目社員の三田村です。

私は「統計検定準1級」に挑戦し、1 度目はCBT(Computer Based Testing)試験で不合格となりましたが、再度1ヶ月学習して2022年3月に合格することができました。かなり苦労して学習に取り組みましたので、これから受験予定の方には私よりも効率的に合格していただきたいと思い、記事を執筆しております。

この記事のターゲット

・データサイエンティスト志望で即戦力として活躍したい方
・現役データサイエンティストでさらなるスキルアップを目指す方
・統計検定準1級突破に掛かるざっくりとした学習時間、必要な教材、受けられる会場を知りたい方

執筆者について

バックグラウンド
某国立大学の材料系の研究室に所属していました。修士卒です。 学部生、院生の頃に教養で微分積分・線形代数・ベクトルなどを軽く学んでいました。

学生時代に統計の授業を受講してはなかったのですが、友人と1ヶ月くらいこちらの本(統計学演習)を輪読して いましたので、当時2級レベルはあったかもしれません。(今思うと2級から受験した方が良かったと思うため、皆様には2級から受験されることをお勧めします!)

学習開始時のレベル
学習開始時は研究や業務で一切統計検定をした経験はなく、平均の差の検定・カイ二乗検定・線形回帰の演習 問題をギリギリ解けるが、ほとんど理論を理解していないというレベルでした。

 多変量解析・ベイズ統計学・実験計画法・時系列分析はほぼ初学者でしたが、一方で数値最適化やニューラル ネットワーク実装した論文を学生時代に執筆したため、データサイエンス初心者ではありませんでした。

受験のモチベーション

 受験を決めた理由は以下です。

  1. 当時医療データの分析を行うプロジェクトにアサインされていたが、業務で使用できるほどの統計の知識が少なかったので、これを補うため。

  2. 理論レベルでしっかりデータサイエンスを理解できる人材であることの証明の1つにしたい。

  3. 統計、機械学習の知識を広く獲得するため。(統計検定とありますが、古典的な機械学習のほとんど範囲に入っています。)

  4. 会社での評価をあげるため(←コレも重要)

新米データサイエンティストが統計検定準1級を受験してみて

受験した感想として、挑戦して本当によかったと思っています。データサイエンティストとしてはまだまだ新米ですが、自分の統計や機械学習に関する発言に対して自信が付きました。

ちょうど業務で行っていた医療データの分析手法のキャッチアップも兼ねて、一石二鳥の学習となりました。具体的には、オッズ比・リスク比・ロジスティック回帰・クラメール連関係数・カイ二乗検定という準1級で初めて学習したものを、実際に案件でたくさん使用しました。試験対策をしていなかった場合は、これらの手法があるという発想には絶対にならなかったはずです。

準1級の試験範囲を確認された方は分かると思うのですが、範囲が膨大で内容もかなり難しいです。合格するためにはこれらの大部分を理解する必要があるので、計画力と実行力が非常に重要です。
 
将来的にどのような人材となりたいかによって変わると思うのですが、広くそれなりに深く統計・機械学習を学習しどんな案件でも通用する人材を目指すとしたら、とても良い試験になると思っています。
 
当時は、受験費用を節約するために2級をスキップしましたが、受験した方が良かったと思っています。電卓の使い方や本番のPCの操作にあまり慣れていなかったため、1回目の受験では全然時間が足りなくなりました。
 
2級と比較すると段違いで学習コストが大きくなるため、2級を受験してテスト慣れしていた方が、過度なプレッシャーを感じなかったかもしれません。(初めての受験時には、受験1週間前からドキドキしていました。)

合格のためのノウハウ

1、 回により難易度が異なるため、複数回受験して比較的簡単な回を狙う!

準1級のCBT資格を2回受験したのですが、1回目と2回目で体感的に全く難易度が異なりました。

過去問を見ていただくと分かる通り、2021年6月のPBT(Paper Based Testing)資格は鬼のように難しいですが、1回目に受けたCBT試験はこれと匹敵する難易度でした。しかし2回目に受けたCBT試験は、1回目と比較して難易度が下がっていました。そのため複数回受験して、少し簡単な回を狙うという手段もありますので、一度不合格となっても私のように再挑戦されることをおすすめします!

2、試験会場が非常に少ないため事前の確認が必要!

会場が少なく、試験会場を探すのに非常に苦労しました。私が知る範囲で、こちらの2つは試験会場となっています。
 1、東京パソコンアカデミー
 2、オデッセイ テスティング センター

3、電卓の効率的な使い方をマスターする。

皆様は電卓で分散やカイ二乗検定の計算をする際に、どのように計算されますでしょうか?このような面倒な計算を楽に行うことができるのが、メモリキーです。こちらを使うと使わないのとでは、全く解くスピードが変わるので必ずマスターしましょう!

私はCASIOのこちらの電卓(JF-120GT)を購入したので、まずはCASIOのYoutubeチャンネルの電卓の使用方法の動画を確認して、そのあとはこちらのYoutubeチャンネルにて使用方法を学びました。その後はひたすら過去問と演習を、電卓を用いて解きました。大体、慣れるのに1ヶ月くらいは掛かるかもしれません。

学習方法

1、学習期間・時間

途中で期間が空いてしまったため、合計約6か月かかりました(学習期間は2021年5月~6月と2021年12月~2022年3月)。250時間ほどで1度目の試験を受けて不合格となったのですが、そのあと重点的に50時間ほど学習し、晴れて合格となりました。そのため合計学習時間は約300時間でした。

2、環境作り

社会人の資格勉強は本当に大変だと思うのですが、中でも強い覚悟が必要なテストのため、環境作りがとにかく大事です!範囲が広すぎますし、学習をしていて全然分からない箇所もたくさん出てきて、すぐに挫折しそうになります。(私は1度挫折しました。) そこで私の実際に意識した環境作りをシェアしたいと思います。

  • 社内勉強会
    まず仲の良い会社の同僚4人組で、Slackのワークスペースを開設して、統計検定準1級学習チャンネルを作成しました。そのグループの方々と毎週1回統計実践ワークブックという公認の準1級の参考書を使用して学習しました。

    全部で32章ととても多いため、「全員が学習したい1つの章について、1人が1週間でその1章を本気で読み込み、同時に他の3人は軽く読み込み、1週間後に本気で読み解いた1人が他の3人に教える」 という学習方法を取り入れていました。

    統計実践ワークブックは、1章1章が非常に重たいです。それを全て1人で解読するよりも、4人で分担して解読し、各分野のエキスパートとなって教えあうと楽だよね!という発想からこの学習方法に至りました。

    他人に教えられるレベルになることで、本当に自分の身になっている感覚がありましたので、この学習方法は準1級の学習で特におすすめです!


  • 都立図書館
    準1級を学習するにあたって、範囲が広いためどうしてもすぐに忘れる内容もあります。そこで忘却するスピードよりも吸収のスピードを高める必要があり、なるべく短期間で学習を終わらせるために、週末だけでなく平日も学習をしていました。

    準1級の学習時間を多く確保するために試験直前では業務をできる限り集中して早く終わらせ、平日19~21時頃まで都立図書館にこもりました。

3、使用した教材とそれぞれの対策時間

※学習順

(ア)標準より少し簡単な統計
【書籍】統計学演習
  ネット上にて無料でダウンロードできる統計の教科書です。名前の通り、演習問題がとても多く、実際に手を動かして問題を解くことで自信が付きました。ただ(イ)の教材を読み解くことのできるレベルの方は、この教材は必要ないです。

30時間 4周

(イ) 標準レベル統計
【書籍】統計学入門(東京大学出版会)
 統計の学習サイトのほぼ全てでおすすめされている本です。ただ少し難しいので、1段階簡単な教材である(ア)のような教材を使ってからこちらの本で学習をされるのをおすすめします。具体的には、この教科書の演習問題を最低3周し、8割以上取ることができるようになれば、(ウ)の教材を読み進めることができるという印象です。またこちらは、統計学入門の演習の解説をされたサイトで、かなり参考にしていました。

60時間 3周


(ウ)全範囲網羅
【書籍】統計学実践ワークブック
統計検定公式の参考書となります。準1級合格を目指すのであれば、必ず購入されることをおすすめします。ワークブックの章末に演習問題がありますので、それを一通り解くことができるようになるまで取り組む必要があります。ただものすごく難しいので、各章を読み解くために以下(エ)~(コ)の教材を使っていました。各章を読んで苦にならない方は、(エ)~(コ)の教材は必要ないです。

90時間 2周


(エ)多変量解析
【書籍】意味が分かる多変量解析
 多変量解析初学者におすすめの教材です。次に紹介する多変量解析入門を読み解く前段階として使えます。

5時間 1周


(オ)多変量解析
【書籍】多変量解析法入門 (ライブラリ新数学大系)
 こちらの教材でしっかり学習することで、準1級の多変量解析の問題のレベルに対応ができました。

20時間 2周


(カ)ベイズ統計学
【書籍】これならわかるベイズ統計学
ベイズ統計学初学者におすすめの教材です。

10時間 2周


(キ)時系列解析
【動画】AIcia Solid Project 【時系列分析③】ARMA過程と誤差項の意味【ついに時系列の始まり!】
教科書を読んでも、時系列のAR過程・MA過程・ARMA過程がよく分からないという方は、こちらの動画を見てみてください。分かりやすく、おすすめです。

3時間 1周

(ク)時系列解析 
【書籍】人文・社会科学の統計学(東京大学出版会)
時系列解析の章が分かりやすかったです。

3時間 1周


(ケ)実験計画法
【書籍】自然科学の統計学(東京大学出版会)
 実験計画法の章が非常に分かりやすかったです。実験計画法はものすごく忘れやすいため、試験直前に詰め込むことをおすすめします。

10時間 3周


(コ)サポートベクタマシン
【動画】Able Programming 【機械学習】サポートベクトルマシン(前編)|  SVMの理論、ハードマージンとソフトマージン
SVM初学者でも非常に分かりやすかったです。

3時間 1周

(サ)過去問 
【書籍】日本統計学会公式認定 統計検定 準1級 公式問題集
 過去問は非常に重要です。こちらの教材には6回分の過去問が掲載されております。しかしながら、準1級は難化傾向があり、2021年6月と2019年6月以外は少し簡単なために、これらの問題が解けるようになったとしても安心できません。私が1回目受験した試験は、2021年6月と同じくらいの難易度で、全然解けなくて焦りました。

50時間

合計約300時間

最後に

今回は、私の経験を元に統計検定準1級の学習方法・勉強時間・会場・教材をまとめてみました。
私はこの学習経験からデータサイエンティストとして、大きく成長できたと感じておりますので、この領域に興味がある方にはとてもおすすめできる試験です!

この記事が1人でも多くの方の合格の手助けになりましたら幸いです。

(執筆:三田村)


少しでもお役に立てましたら♡を押していただけると励みになります!

▼コーポレートサイトはこちら

▼新卒採用はこちら

▼キャリア採用はこちら