見出し画像

SQL、Python、Rを学習したいデータサイエンティスト初学者必見!100本ノックで処理をマスター!

こんばんは。

今日は私も最近練習し始めた100本ノックについて。

ここではSQL、Python、Rを学習する上でどのように「量」をこなすかについて、データサイエンティスト協会が出しているデータサイエンス100本ノック(構造化データ加工編)について紹介します。

IT人材を育てる団体 データサイエンティスト協会

データサイエンティスト協会とは、データサイエンティストに必要なスキルや知識を身につけるためのカリキュラム作成や交流会などをおこなっている団体です。

画像1

民間企業だけでなく、大学や個人とも密接に関わり日本のIT人材の育成に尽力しています。

私も登録していますが、よくシンポジウムや各民間企業が開催するAIなどのセミナーに協会経由で参加することができます。

勉強会やセミナーなどは最新動向から育成方法までにわたり展開してます。

そんなデータサイエンティスト協会が、Githubにて初学者むけにSQL、Python、Rの環境を用意しています。

SQL R Python初学者は利用すべき 100本ノック

100本ノックとは、データサイエンティスト協会がGitHubで公開しているデータサイエンス初学者向けの構造化データの集計・加工を効率的に学べる学習環境です。

githubは以前の記事にもまとめたように、ソースコードを管理するプラットフォームになっています。他社が作ったプログラムをgithubからみることが可能です。

データサイエンティスト協会は、github上にて使用言語はPython、R、SQLと選択することができ幅広い言語で無料学習することができます。

SQLはデータベース言語、Rは統計処理、PythonはAIなど強化学習を実装することができるため3つの言語がそれなりに使えたら十分でしょう。

100本ノックの概要としては、こちらになります。

●データサイエンス100本ノック(構造化データ加工編)を実践するための演習問題とデータ、および環境構築のためのスクリプト一式
●演習問題はSQL、Python、Rで共通
●「この言語のときはこう書けば実現できる」という技術習得を目指すことを優先
●個人情報のように見える項目は全てダミーデータを利用
●「データサイエンス100本ノック(構造化データ加工編)」を利用していることを明示いただければ自由に利用してOK

ダミーデータを使って、SQL、Python、Rを学習していくということでデータを使いながら各問題を解いていき処理に慣れていく、ということになります。

新しく言語を学ぶ過程でよくあるのは、「あーわからない!!!!」という光の見えないトンネルに突入することで迷子になることですね。

そうなる前に、基礎を固める上でこういった学習環境を使っていくことをお勧めします。

始め方 セットアップ〜

早速始めていきましょう。まずは「データサイエンス100本ノック」を使用する為に仮想環境を用意する必要があります。

手順はコチラになります。

①Docker公式サイトにアクセスして「Docker Toobox」をダウンロードすること

②インストール

③Github 上にある設定ファイルをローカルPCに落とし込む

これで設定が完了です。やや細かい注意点等あり少し大変かもしれませんが、githubを含めた環境に慣れるいいチャンスです。ぜひトライしてみてください。

macで実装する場合とwindowsで実装する場合で異なりますが、それぞれで動作ができるようなのでご自身の環境にセットアップして実装してみてください。

私もRはやったことがなかったので現在100本ノック中です。。。

鍛錬あるのみ

初学者にとって、いきなりプログラムを作らないといけない環境ほどストレスのかかることはありません。いわば道わからぬ状態で大海に放り込まれるような感覚です。

そんな中で、まずは1球ずつスイングを確認しながら打感を確かめていく作業をプログラミングにおいてもしていくことで慣れてくことができる100本ノックは、自己鍛錬においては非常に有用かもしれませんね。

では。








この記事が気に入ったらサポートをしてみませんか?