~データラーニングスクール設立に込めた3つの想い~
参加者160人を超えるデータ分析特化のオンラインサロン「データラーニングギルド」の代表をしている村上です。この度、「データラーニングスクール」というエンジニアからのキャリアチェンジに特化したデータサイエンス講座をリリースしました。
他のスクールなどと比べて、以下の3つの特徴を持っている所がデータラーニングスクールの特色となっています。
・機械学習に留まらない圧倒的守備範囲の教育カリキュラム
・オンラインコミュニティを通じた学習支援
・育成も含めた本当の意味での転職サポート
詳細に関してはこの記事の後半で深堀をして行きたいと思うのですが、まずは、なんでこういった特色を持ったスクールを始めたのかということについて、お話をさせて頂きたいと思います。
データラーニングスクールでは、1年くらいの期間をかけて以下のような成果を上げることを目指しています。
・年収400万円~600万円程度のエンジニアが年収を100万円上げる
・月単価55万円~75万円程度のフリーランスが月単価を10万円上げる
・全くの未経験の人材が業種を変えて転職できる(年収は下がる可能性も)
巷のプログラミングスクールでは、どのくらいの期間をかけて、どんなところをに導くのかというゴール設定と、そのための構造設計ができていないように感じます。
自分はデータラーニングギルドというオンラインサロンをやっていたり、初学者の話を聞いたり、データサイエンススクールでデータ分析について教えたりしています。その中で、初学者の方に接する機会も多いです。
世の中の情報やコンテンツが偏っていて、その情報に踊らされている人が多すぎます。まずは、よくあるいくつかのパターンに関して、少し物申させてください。
データサイエンティストになるためにpythonを勉強しています!!
これが非常に多いです……あまりにも多すぎます……
「pythonで効率化して脱Excelをしよう!!」みたいな話に踊らされている方が多すぎるように感じます。
確かに、Excel仕事は効率が悪すぎることが多くて、「脱非効率!!」みたいな話には良いとは思います……
ただ、Excelに関しては非常に優秀なツールで100%使いこなせば様々な用途に活用できます。
ピボットテーブルと分析ツールなどを使えば多くの分析をExcelのみで完結できますきちんと使ってるのか?
また、自動化に関してもVBAやマクロを使って自動化できます。
ただpythonがやりたいだけじゃないのでしょうか?
使うツールは本質的な問題ではありません……
データを取る、数字を見る、考察をする、仮説を立てる、仮説を検証する、そしてそれを元に意思決定をする。
まずはそこからです。データサイエンスに必要なスキルの中でpythonはごく一部のスキルです。世の中の流れ的にも、pythonを使わなくてもモデルが作れ、分析ができる方向に進んでいます。
RPGをやるときに、攻撃力特化でキャラクターを作りますでしょうか?
ステータスは全部攻撃力に振って、最強の武器を手に入れて、最強の攻撃スキルを手に入れて、守備力や防御に全く力を入れていないから実際に戦いになったら相手の攻撃一発で死んでしまう。
このようなRPGの世界で考えるとバカげたようなレベル上げの仕方ですが、実際の世の中ではたくさん起こっているんです。もちろん、魔法に関するするスキルは後から習得する前提でまずは攻撃と防御に割り振るみたいな戦略は有効だし、全部一気に学習するのはなかなか大変だと思うので、全てを学習しろとは言いません。
頼むから、ちゃんと戦える、実践で役に立つスキルを、そのバランスを考えて学習をしてほしいんです。
たったの3ヶ月であなたもデータサイエンティストに!
なれません!!!
データサイエンティストへの道のりは非常に難しいです。
データサイエンティストを目指している人を200人以上見て来ましたが、3ヶ月なんかでなれる訳がないです。少なくとも年単位は覚悟しないとダメです。
仮になれたとしても、その人は高校、大学でしっかりとデータサイエンティストに必要な基礎を勉強して、積み上げて来た人です。
データサイエンティストに求められるスキルは本当に幅広いです。そして、それぞれの領域の難易度が高く、必要となって来る前提知識も多くあります。
情報系の学部では大学4年間もかけて線形代数学や微積、確率論や統計学、プログラミングやコンピュータサイエンスに関して学ぶ訳です。
それをいくら圧縮したとしても、3ヶ月なんかで身につく訳がない。
人間の集中が持つ、そして頑張れる期間として「3ヶ月」という期間はちょうどいい。だから3ヶ月という期間で区切っているだけだ。私がリリースした講座も3ヶ月で詰め込めるだけ詰め込んでいます。
でも、それは学習のための最低限の基礎知識です。
3ヶ月という期間で「仕事の一部をお願いする最低限のスキル」という意味ならつくかもしれないです。でも、それは決して「データサイエンティスト」と言えるレベルのものではないでしょう。
AIに仕事を奪われるから、AIを作る側に回ろう
そもそも、まだ世の中にはデータが全然ありません。
AIを作る側はその道10年とかやってるベテランの天才たちがやっていて高度な技術が必要だから高単価なんです。
キラキラしたイメージに憧れてデータサイエンティストを目指す人が多すぎるんじゃないかなと思います。
一番最初の仕事なんて、泥臭く色んな所からデータを集めて来る仕事だったり、BIの構築や可視化、簡単なデータの前処理や集計辺りが関の山です。全体感なんて全然見えることもないと思います。
データサイエンスの仕事は、8割くらいがデータの準備、要件のすり合わせ、前処理、各組織への展開といった地味な仕事です。AIを作るということはそういうことです。
自分の好きな話に、「3人のレンガ職人」という話がある。簡単に話を纏めると、同じレンガを積むという仕事でも、ただの作業なのか、歴史に残る教会を作るためにやっているのかで意味合いが違ってくるという話です。
「AIを作る」と聞いたときに考えるイメージは、研究開発やディープラーニングの実装といったキラキラしたものだろう。ただ、現状データサイエンティストにおける仕事の多くは、レンガ積みのような地味な仕事です。
それでも、「世の中を変えるためにAIの開発に携わりたい」という人がチャレンジすべきだと思います。
データサイエンスにおいて大事なことって何?
では、データサイエンスにおいて大事なことって何なのでしょう?自分は、以下のようなスキルが大事だと考えています。
・ビジネス上の課題を見つけて、良き問いをしっかりと立てられること
・その問いの対して適切な解決策を提案できる幅広い知識と経験、バランス感覚
・自分の持てる武器を使ってしっかりと問題の解を導き出すこと
・そこから導き出された答を現場に浸透させてビジネス価値に転換すること
それは、決して、pythonを使ってディープラーニングのネットワークが構築できるようなことじゃないです。
「そういった能力をどうやって身に付けていくのか?」ということを考えた上で辿り着いたのがこのデータラーニングスクールの仕組みです。
データラーニングスクールがどんな構成なのか、なぜそんな形にしたのか、構成と想いに関して説明させて頂きたいと思います。
機械学習に留まらない圧倒的守備範囲の教育カリキュラム
データサイエンスの道は険しいし、難しい。それは間違いのない事実だと思います。例えば、自分が独立してからの案件を振り返ると、時系列解析、3D画像処理、異常検知、アクセス解析、BIの構築など多岐に渡るプロジェクトに関わらせて頂きました。
プロジェクトによって使用する技術、課題は千差万別です。それに対して柔軟に対応して行く必要があります。Excelのデータを集めてデータセットを作る場合もあれば、BigQueryといったビッグデータを処理するデータベースを中心に分析基盤を構築することも、APIを開発するようなこともあります。
会社さんのステージに関しても、既存モデルのコンマ数%の精度の改善が数百万円、数千万円の価値に繋がる状況もあれば、データ活用が行き届いていなくて、集計・可視化・提案・施策展開といったステップを踏むだけで価値を提供できる状況もあります。
業種、業態に関しても、飲食業界における分析、旅行業界における分析、物流業界における分析など、扱うトピックによって全然前提条件やビジネスにおける重要な要素が変わって来ます。
そんな複雑な要素が絡み合う中でチームの一員として価値を発揮して行かなければならないのです。少しpythonが書けてモデルが作れるくらいだと到底太刀打ちできません。モデリングの業務だけが都合よくアサインされることなんてまずありません。
では、どんなスキルや知識が必要なのでしょうか?
データサイエンスを実施するに当たって、いかに他の部署に協力して貰ってデータを取得したりシステム連携をしたりするか、いかに施策提案を現場に浸透させるかといったことが重要になってきます。そのためには、インセンティブ構造設計が必要になってきます。インセンティブを設計するために、ゲーム理論を元にした考え方は非常に役に立ちます。
また、クライアントの課題の抱えている課題を解ける問題に落とす必要もあります。その場合は、「コンピュータを使ってどんな問題が解けるのか?」ということを知っておく必要があり、かつ現実問題を抽象化して問題に落とし込まなければいけません。機械学習に関する知識だけでなく、コンピュータサイエンス、コンピュテーショナルシンキングといった物への理解も重要になるのです。
データサイエンスのアウトプットは基本的には一般の人に分かりにくい難解なものになりがちです。それをしっかりと間違いなく、過不足なく伝えるためにあ、ロジカルシンキングやドキュメンテーションのスキルが必要になって来ます。
これらの内容を統合して自分で学ぶのは非常に困難だと思います。それらを3ヶ月で実践レベルまで教えることは非常に難しいですが、全体感を掴めるような構成になっています。
「何が重要なのか?」を知ることで問題解決の糸口になったり、「どこまでの範囲を知ればいいのか?」というインデックスを作ってあげることで学習の指針になったりして、その後数年間の学習を飛躍的に伸ばすことができるのではないかと考えています。
データラーニングスクールのカリキュラムは以下のような内容になっており、機械学習はもちろん、特に「実践で必要な周辺スキルの習得」にフォーカスを置いています。
・第1週 マインドセット・タイムマネジメント
・第2週 データ分析を支える思考プロセス
・第3週 データ分析基礎
・第4週 ドキュメンテーション・レポーティング
・第5週 データベース・集合・BigQueryを用いたSQL入門
・第6週 SQLを用いたアクセス解析実践演習
・第7週 pythonで学ぶ統計学
・第8週 機械学習前編(教師あり学習)
・第9週 機械学習中編(教師なし学習、ディープラーニング、強化学習)
・第10週 機械学習後編(特徴量エンジニアリング、評価手法、実務への適用)
・第11週 CRISP-DM・ゲーム理論・マーケティングフレームワーク
・第12週 総括
オンラインコミュニティを通じた学習支援
データラーニングスクールを運営している株式会社データラーニングでは、「データラーニングギルド」という、160人以上のデータ分析人材が所属するオンラインサロンを運営しています。
何か新しいことを学習をするに当たってコンテンツと同じかそれ以上に重要なこととして、学習する環境、つまりは普段接している人たちであったり、普段触れる情報であったりという所があるかと思います。
データラーニングギルドでは、自分の一歩先を行っているデータ分析人材に触れることで、キャリアを見定めるようなことができればと考えています。
データラニングギルドの中でどんな活動をしているかと言いますと、主な活動としては、日々のニュース共有を起点にしたディスカッションや質疑応答、各種分析企画、オフ会などのイベントを中心に活動しています。例えば、「大学院に行くべきか?」という質問に対して質問が出た際には、様々な立場の人から、様々な視点を元にしたアドバイスを貰うことができます。
キャリアに関する質問はもちろんのこと、各種アルゴリズムに関する質問であったり、メモリの節約方法といったテクニック、データ分析の活用方法に至るまで、「データ分析」という幅広いトピックにおいて、かなり精度の高いフィードバックを得ることができます。
他にも、データ分析の企画なんかもやっています。以下の企画では「slackのデータを分析してみましょう!」というテーマで、実務に近い課題を分析して頂きました。
slackデータを使った分析では、自然言語解析を使ってその週のトピックを分析したり、その人の特徴を抽出したりするような取り組みも行っています。
分析企画を通じて、その方の実績やポートフォリオといったアウトプットになり、一段上のスキルが身につくように作成できるようにフォローアップするよう心がけています。
その他にも、現在6チームがkaggleのコンペに参加していて、その取り組みの結果として過去にメダル獲得したチームも複数出てきています。
転職やインターン、業務委託の依頼といった形でデータサイエンスのファーストキャリアが獲得できるようなマッチングに関しても随時実施しています。
上記のように、データラニングギルドでは情報収集、キャリア相談、実績作り、ファーストキャリアの獲得からキャリアアップまで、データ分析におけるキャリアのほとんどと言えるレベルの幅広い範囲をサポートしています。
また、データサイエンティストを目指している未経験の方から実際に業務でデータ分析の業務を行っている方、フリーランスや会社役員としてバリバリ活動している方まで参加していて、非常に多様性の高いコミュニティになっています。以下のAdvent Calendarなども参考になるかと思います。
では、なぜコミュニティを中心に置いた教育をやっているのか?
それは、オンラインサロン型のコミュニティが専門領域の学習において非常に効率良いからです。
データサイエンスという領域のことを考えると、学習することが多岐に渡って、数年の経験があったとしても、全然完璧にでいるというレベルまでは至りません。一生学習が必要で、専門領域や得意領域もまばらにならざるを得ないです。
また、データサイエンスのキャリアが難しい理由として、得意技術と得意なビジネスドメインの掛け合わせで物事を考えて行かないという所もあります。同じ統計手法を活用したとしても、着眼点やアウトプットは業界によって全然違います。
なので、1人からのアドバイスだと偏りがあったり、適切なアドバイスが出せなかったりということが必ず発生します。そこで、オンラインコミュニティという形で、データ分析の経験がある人どうしでお互いに教えあう形を取ることでスクール形式ではカバーしきれない多岐に渡る視点やカバー範囲を実現できればと考えています。
育成も含めた本当の意味での転職サポート
データラニングスクールの3つ目のメリットとして「育成も含めた本当の意味での転職サポート」が挙げられます。
これがどういったことなのか?
まず、転職サポートをしている会社というと、どんな会社が思いつきますでしょうか?
いわゆる、転職エージェントと言われる会社が真っ先に思いつくかと思います。他には、プログラミングスクールなどが思いつく方もいるかもしれません。
これらの転職サポートをしている会社では一部で問題が発生していて、それを避けるのが難しい構造になっています。
転職エージェントのビジネスモデルは、転職が決まったら転職先の企業から年収に応じて成果報酬を貰うような形になっています。そのため、「転職をさせる」、「できる限り高い年収で転職させる」という結果になるようにインセンティブが働きます。
このインセンティブ設計によって起こる問題は何か?
「転職をするに当たってベストでないタイミングでも転職を斡旋してしまう」という問題が発生してしまいます。
もう少ししっかりと勉強をして実績を作ってから転職活動をするべきであったとしても、「今はまだタイミングではないのでもう少し勉強した方が良い」といったアドバイスはなかなか難しいような状況が構造的にあるかと思います。
本当にその人のことを考えた場合、「3ヶ月程度でこういったスキルを付けて、社内でこういった実績を作った上で転職を始めよう」といったアドバイスや、「まずは社内で部署移動の願いを出してみたらどうか?」といった色んな選択肢を考慮に入れたアドバイスは難しいと思います。それは、転職エージェントが「転職させる」という選択肢の中から選ばなければならないからです。
プログラミングスクールに関しても同じような問題が発生していて、講座の卒業生のスキルを更に底上げするという選択肢が無く、「転職させる」という選択肢の中からキャリアをサポートする必要があります。
自信の教育の経験照らし合わせて考えると、講座期間中に伸び切らない方も一定数いますが、そういった方に関しては技術要件の低い入りやすいSES企業などにねじ込む必要が出てくる訳です。人材紹介のフィーがビジネスの中心になっている以上これは避けて通れません。
じゃあ、それを解決するためにデータラーニングスクールがどんな構成を取っているのか?
それが、「オンラインサロン型の教育システム」です。その人のキャリアアップを支えることにインセンティブが働くような形を取っています。
月額の会費制を取っているので、その人が長く続ければ続けてくれるほど会社の利益になる仕組みになっている訳です。しかも、その中でその人が成長してくれることで転職時の年収もアップする訳です。年収がアップすれば人材紹介のフィーも上がるので、育てることにインセンティブが働く訳です。転職した後もコミュニティの中で接点を持ち続けることにより、転職した後に仕事を発注して貰ったり、コミュニティの中で教える側に回って貰ったり、数年後の転職時に一緒にプロジェクトに参加して貰ったりと、様々なメリットが発生するのです。
なので、「その人のことを真剣に考えてサポートして長期的な関係を築くことが利益につながる」という状況ができている訳です。コミュニティの中の人をサポートして成長するほどコミュニティが育って所属しているメンバーが全員得をする。そんな環境を環境を模索した結果、オンラインサロン×スクール型の教育システムに辿り着きました。
データサイエンスは難しい、それでも勉強する価値はある
この記事の中で何度も繰り返して来たけど、データサイエンティストを目指すなら3ヶ月なんかじゃ到底足らない、人生をかけて学び続ける覚悟が必要だ。
それでも自分はデータサイエンティストをおススメしたい。時間をかけても勉強する価値があるだけの魅力があることをお伝えしたい。
全ての業種、業態でデータ活用は必要とされており、多くの人に価値を届けることができる。技術的にも、ビジネス的な知見の発見としても、常に新しいことが知れて好奇心が満たされる。仕事は常にチャレンジングで、複雑な要素が絡み合った中でいかに価値を提供できるかに深い思考を巡らせる必要がある。そして何より、これからの新しい時代を切り拓くメンバーの一端を担える。
職業の将来性としても申し分ない。AIやIoTに関わる先端人材は2030年には55万人足りなくなる一方で、受託開発や保守運用を担う従来型IT人材は10万人余ると予想されている。(※参考:IT人材需給に関する調査)
上記の調査はコロナウィルスが流行る前の調査結果だ。コロナウィルスの流行を期に一時的に景気が落ち込む可能性は高いが、個人的には、データサイエンスに関する技術に関しては加速する可能性が高いと考えている。
コミュニケーションがオンラインに移行することでトラフィックは爆発的に増加している。代表的なものとしてzoomが挙げられるが、昨年12月は1000万ユーザーだったユーザーが、2020年の3月には2億ユーザーと20倍の成長を遂げている。
つまり、オンライン上でやり取りをすることによるデータが増えている。コミュニケーションの主軸がオンラインに移ったことにより、先ほどのslack分析で紹介したようなコミュニケーションの分析が活発になるだろう。
快適に円滑にコミュニケーションを進められるようにするための技術投資も増えて行くことは間違いない。
不景気になった際に最低限の人員でオペレーションを回すためにはデータを活用したリソースの調整、最適化が必要だ。
人間に触れることを避ける世の中では、ロボティクスの導入が進むかもしれない。
空気の換気状況を正しく図るためにIoTセンサ導入と分析が進むかもしれない。
今回の変化でデータの活用や技術の革新が半ば強制的に求められている。ポジティブに取って良いものなのかは悩ましいところだが、コロナウィルスがデジタル化とデータの利活用を促進するのは間違いない。
今、世の中は不確定だ。変化に耐えうるスキルを身に付けて、コミュニティに所属し、変化に耐えうる状況を作っておこう。必要とされるスキルと繋がり、そして不確定な状況に耐えうるキャッシュがあれば、そんなに未来は暗くない。
不確定なことが多い中で不安も多いことだろうけど、今、腰を据えて、未来を見通して、次の時代に必要とされるスキルを見定めて、身に付けて行こう。もしそれがデータサイエンスに関わることだったとしたら、頭の片隅にデータラーニングスクールやデータラーニングギルドのことを置いておいて貰えると嬉しい。
この記事を読んで興味を持ってくれた方の中で、データサイエンスという仕事やデータラーニングスクール、データラーニングギルドに興味を持ってくれた方、キャリアについて考え始めてくれた方は以下のリンクからキャリア相談会に参加できるので是非オンライン飲み会ぐらいのノリで遊びに来てください。あなたのご参加をお待ちしております♪