見出し画像

非プログラマーかつ統計知識ゼロ からGeorgia Tech Online Master of Science in Analytics 合格まで

今週からジョージア工科大学(Georgia Institute of Technology)のデータアナリティクス修士コース(Online Master of Science in Analytics / OMSA)の春学期がスタートしました。昨年2022年3月16日に合格通知を受け取り、2022年の秋学期からスタートして2学期目。何とかやっていけそうな感触を掴んだので、学んだ内容を書き留めていこうと思います。

Georgia Techからの合格通知

プログラマーでもなく統計の知識も皆無だった私にとって、以下のように他の方々の準備ブログは大変役に立ちました。

そこでまずは私も出願を決めてから合格までの経緯を書き留めておこうと思います。

志望動機

私は現代アートの海外向け広報の仕事をしています。広報をしていて、作品に興味がある人にその情報がもっと効率的に届けばいいのにな、と常々感じていました。そのほかにも様々な切り口でデータサイエンスを現代アートの業界にも活かせそうだ、というのが1つ目の動機です。

2つ目は、データサイエンスの知識を身に付けたことを修士号として示したい、ということです。正直、この分野はオンライン上にたくさん教材が揃っていて独学可能な分野だと思います。ただ、私の場合は現在の職務の延長上でデータサイエンスを使っていくためには、先に専門的な知識があることを客観的な指標示す必要があると感じ、出願を決意しました。

出願校の決定

ジョージア工科大学(Georgia Institute of Technology)が提供するオンライン大学院データアナリティクスコース(OMSA)の利点は「安さ、応募要件の広さ、オンラインでの実績」です。

費用が安い:ざっくりですが、1講座が約10万円くらいで、卒業要件は10講座+実習(約20万円)なので、合計約120万円。
応募要件:CS専攻やプログラマー経験を前提要件とする大学院が多い中、それらの知識を独学で身につけたことを証明(詳細は後述)できれば受け入れてくれます。GA tech側も門戸の広さを売りにしています。その分脱落者も多いようです。
オンライン授業:OMSAは2017年からのオンライン授業の実績があり、受講できる科目も増え、年々改良を重ねられています。自分の時間で自習して進められるのはとても取り組みやすいです。

結局この1校しか出しませんでした。10倍の予算があるなら、他の有名校(バークレーなども)も魅力的に見えました。

出願準備前の知識量

慶應大学理工学部を卒業していますが、応用化学を専攻していましたので、プログラミングも統計も知識ゼロ。新卒2年くらいSEをしていたときにプログラミングを多少習いましたが超初心者。その後、現代アートの業界へ転職してからは職務上プログラミングも統計を使うことはなく。出願準備にあたり独学を始めました。

redditにはOMSAの合否結果を報告する掲示板があり、これを見ると合否のラインが見えてきます。プログラマーや統計を仕事として使用した経験のある方は即合格。その他の場合はオンライン講座などを受講しその知識があることを証明できれば合格しているようにです。

出願前に独学していた内容

統計検定2級(2021年1月〜)

データサイエンスについて調べていたところ、入り口として「統計検定2級」の知識を身につけると良いと知り取り組み始めました。

オンライン教材の充実っぷりに感動しました。大学でも数学の授業はあったはずですが記憶になく。高校数学の知識からスタートしました。微分とか確率とか懐かしーなーと思いながら。統計検定を受験する変わりにオンラインの講座を探し始め、オンライン大学院という選択肢を検討し始めました。

edXを受講(2021年8月〜)

Georgia Tech はOMSA入学後、最初に受講する3講座を「MicroMasters® Program: Analytics: Essential Tools and Methods」として外部生にも公開しています。OMSA入学に際しての前提知識(統計、数学、プログラミング)を有していなかった私は、この講座で好成績を収めることで応募要件をクリアしようと決めました。

また実際に入学後、この3講座は卒業要件の単位数にも加算されます。(ただし評定には加算されない。)受講料も内部生と外部生で差はありません。既に知識を持っていて入学された人は免除申請ができる講座でもあります。

ISYE 6501 Introduction to Analytics Modeling(2021年8月-秋)

OMSAの学部長Joel Sokolが担当している講座です。データサイエンスのいろいろな手法(SVM、KNN、k-mean clustering、CUSUMなど)をざーっと習っていきます。めっちゃ統計です。前もって統計検定2級に手をつけていたことがとても役に立ちました。使用するプログラミング言語はR。使ったこともなかったのでググりまくりました。講義動画の他、Piazza(ピアッツァ)という掲示板で繰り広げられる質疑応答とTAの補足授業でなんとか課題をこなしていきました。

授業以外では以下の動画に助けられました。

内容はとても面白く、出される宿題をこなすと理解が深まっていくことを実感しました。出願しようという意欲と入学してもやっていけるだろうという自信もつきました。
スコア:92/100

CSE6040 Computing for Data Analysis(2022年1月-春)

ガチPythonの講座です。事前に以下のYoutube見て準備しなきゃなーと思いつつ、結局授業と並行しながら習得していきました。

アルゴリズムも知っていると良いということで自習教材としてCodewarsもお薦めされました。少し手をつけましたが、授業に直接関係あるわけではないです。蛇足ですが、アルゴリズムって中学受験算数ぽいなぁと思いました。解法を知ってれば早く解ける。知らなくても力ずくでなんとかなるときもある的な。

授業ではたくさんプログラミング書きます!numpyとpandasが使えるようになります。ISYE 6501で習った統計手法の知識も使います。

宿題のほかテストは合計3回あり、確か1回4時間くらい。時間いっぱい使い毎回とても疲れました。。。小問ごとにプログラムが通れば得点/通らなければ(あと一歩のところでも)ゼロ点。しかも小問ごとに得点に傾斜あり。初心者は過去問をたくさん練習して、解ける問題から着実に得点することをお勧めします。
スコア:95/100

MGT6203 Data Analytics for Business(2022年5月-夏)

講義とグループワークの講座です。内容はイマイチ。講義とテストでは用語や概念の暗記が多かった印象。グループワークでは、4人で1つのプロジェクトを進めます。このとき内部生と外部生は一緒にならないよう配慮?されています。グループワークの内容はデータを探してきて、データサイエンスの手法を使って検証してみようというもの。レポートも書き、動画でプレゼンもします。外部生として受講しましたが、他の受講生と交流が持てるのは新鮮でした。
スコア:96/100

出願書類の準備(2021年10月〜)

書類の準備

  • Official transcripts(大学の成績表と在学証明書)… 慶應大学はオンライン経由で申請でき、GA Techへ成績を直接送付できました。

  • Resume(履歴書)… ネットに落ちている定型分を参考に作成。Certificateという欄を追加し、ISYE 6501を受講済みであることとスコアも追記しました。

  • GRE or GMAT scores … 必須ではありません。私は提出せず。

  • TOEFL Score … 最低スコアは100。私は99で提出。

TOEFL準備と受験(2021年10月〜12月)

仕事で英語を使っていたので、最低限で済ませたいと考え受験は1回のみ。

リーディング … オンラインのフォーマットに慣れるため公式サイトで練習。
リスニング … フォーマットに慣れるため公式サイトで練習。
スピーキング … 以下のYoutube動画を参考に練習。特に1分で話す練習。アプリTOEFL GO!も使えます。
ライティング … 以下のYoutube動画を参考に練習。特に構文に則る練習。

リスニングやスピーキングでは手元にメモを取る必要があるのですが、持ち込めるのがホワイトボードとマーカーと消すやつのみ。ペンと紙で練習していた場合、直前にホワイトボードペンの太い感覚に慣れておく必要あります。
私は2022年12月にTOEFLiBTを自宅で受験。10日ほどで結果が届き、恥ずかしながら99点。ただ4時間のテストを再受験する気力もなくこのまま提出。

志望動機と推薦状(2021年10月〜2022年1月)

  • Statement of Purpose (志望動機)… 合否に関わる一番大事な書類になります。Donald Asher著「Graduate Admissions Essays 」のサンプルエッセイを参考に作成していきました。以下が大学からの指示書。

Your statement of purpose should be a concise, well-written document about your academic and research background, as well as your career goals. Be sure to discuss special areas of research or interest. Additionally, it can communicate how Georgia Tech's graduate program will help you meet your career and educational objectives. You can type your statement of purpose in the text box below (1000 words count limit)

つまり、①前提となる知識はあるのか ②何を成し遂げたいのか ③GA Techが②をする上で必要となる理由 を明確に述べる必要がある。何度も書き直し最後にオンラインのネイティブチェックも入れてから提出しました。
難関大学院の場合は、エッセイで他者より目立つ必要がありますが、OMSA の場合はしっかり理屈が伴っていれば大丈夫だと思います。

  • 3 Personal References(推薦状3通)… 私自身はフリーランスであり、かつデータサイエンスと関係ない業界で仕事をしているので、推薦状に苦心しました。通常は大学教授1通と会社の上司2通というパターンが多いよう。この選択肢は取れない私は、近年一緒にお仕事した3名に依頼しました。11月に依頼、12月に素案作成、1月にサイト経由で提出して頂きました。それぞれ自分の強みのどの部分を書いてもらうのかを考え、それを証明するエピソードを思い出す作業が必要となります。

出願から合格発表まで(2022年1月〜3月)

一般締め切りが2月1日のところ、ギリ1月28日に出願しました。この時点ではedXのISYE 6501のみ終了していてCSE6040を開始したところでした。合否が出始める2月中旬にCSE6040の中間テストがあり失敗し焦りましたが、無事3月16日に合格通知をもらいホッとしたのを覚えています。

合否は2月中旬から出始めます。ですので、出願の最終締め切りは3月15日ですが応募要件を満たしているか微妙な場合には1月中に提出することをお勧めします。

今後の履修予定

OMSAには3つのコースがあります。Analytical Tools / Business Analytics / Computational Data Analytics。入学時にコースの希望を聞かれますが選択する必要はありません。コースごとに履修科目が決まっていて、条件を満たす科目を受講すれば該当するコースでの卒業とみなされます。私はディープラーニングやAIを履修する予定なのでComputational Data Analyticsコース。

今のところ以下のような予定を立てている。1学期の受講数を2講座に増やしたり、あたらに追加された自然言語処理などを追加する可能性もある。

2022年秋 ISYE 6999 Deterministic Optimization (終了)
2023年春 ISYE 6740 Computational Data Analytics
    夏 MGT 8803 Business Fundamentals for Analytics
    秋 CSE 6242 Data and Visual Analytics
2024年春 CS 7643 Deep Learning
    夏 CSE 6748 Applied Analytics Practicum
    秋 ISYE 8803 High-Dimensional Data Analytics
2025年春 CS 6601 Artificial Intelligence

また、卒業単位数に達しても「卒業」を申請しなければ引き続き受講することも可能。

上記サイトでは、OMSAの各講座ごとの評判と負荷が共有されています。入学後何が学べるのか具体的に分かると思います。

以上、参考になれば幸い。新たなスキルが身につくのは楽しいですよー。