見出し画像

データ分析までのプロセス

データサイエンティストになりたいと思い立ってから早2週間が過ぎ去ろうとしたある日。会社の上司から、我が社でNo1でOnly1のデータサイエンティストを紹介していただきました。しかも私の目標を伝えてくれて、その方にマンツーマンでデータサイエンティストになるためのOJTをつけてもらえることになりました!!!なんと恵まれていることか!!!目標を公言することの重要性を実感しました。
そんな夢のような過程をきちんと記録に残し、自分の血肉にしたいと思います。

大まかな流れ

解決したい課題はあるのですが、機密情報のためそこはシークレットです。
下記のステップを一つづつこなしていくことでゴールを目指します。

⑴データ発掘
文字の通り、社内にどんなデータベースがあるのか、どんなデータテーブルがそのデータベースに存在しているのか、どんな種類のデータがあるのか、誰が管理しているのか、どんなファイル形式か等を調査します。

⑵テーブル定義を作成する
上記で調べ上げたデータテーブルのカラム名と具体的な中身を調べて表にまとめます。
参考サイト

⑶基礎統計
集めたデータを使って簡単な集計を実施します。使用したデータの個数、データてブルの数、合計、平均、差など単純計算で求められるモノを作成していきます。この工程を実施することで上記のテーブル定義もクリアになります。よってテーブル定義とほぼ同時に実施することが好ましいです。

⑷基礎分析
具体的な分析結果をイメージしながら分析をしてみる。結果や観点を仮定し、その仮定が正しいかを分析結果から確認する。

まずはこのプロセスをクリアすることで、今持っているデータでできること、今後取得すべきデータなど、解決策と課題を洗い出していきます。



この記事が気に入ったらサポートをしてみませんか?