見出し画像

初心者がデータ分析を勉強して思った、必要な○○スキル

データ分析やオープンデータをよく聞くようになりました。

データが溢れてきており、いろんなところからデータを持ってこれるようになっています。

そして、データエンジニアやデータアナリストの必要性も高まっています。

私はデータ分析を通してビジネスインサイトを得たいと考えています。

その目的のために、Tableauなどのツールを使ってデータ分析を勉強しています。

勉強していくなかで、これは身につけないとなと思ったスキルが3つあります。


1.データの前処理方法を統一する

前処理とは、データをインポートする前に整理することです。

データ分析ツールにインポートするためには、オープンデータでもそのまま入れては、効果的な分析になりません。

必要ない項目が入っていたり、逆に必要な項目がなかったりするからです。

すぐにインポート出来るぐらい整理されてるデータは、本当に限られています。

では、どうするかというと手作業でデータを入力するわけです。

自動化できれば楽なのですが、APIやPythonの知識が必要になったり。

自動化しても欲しいデータが得られなかったり。

結局手作業が確実で、人海戦術でやった方が逆に早いのです。

インポートするにも、型変換に注意したり、IDを付けたりなどが必要です。

ただ入れればいい訳では無いことを、実際にやってみて実感しました。

データを作るときに、部署間でテンプレートを定めたり、項目を統一したりできたら、その後の分析が楽になるなあと思います。

実際にツールを触ってみたとき、やっぱりこの項目いる!となったら、また時間がかかります。

出戻り発生は避けたいんですよ……

2. 分析結果をいかに「魅せるか」のデザイン思考やUX

やっと前処理が終わって、いよいよツールにインポートします。

そこで立ちふさがるのが、どんなグラフにしてどんな配置にして、何と何をリンクさせるのか、画面構成をどうするのか、のデザイン面です。

何と何を比較すれば、効果的なインサイトが得られるのか。

これとこれをセットにしたら、より重層的に分析できるか。

機械学習はどのデータを使ってやるのか。

レイアウトを考えるには、空間把握力というか、三次元を想像する力が必要だなと思うのです。

データ分析の向こう側にいるユーザがどう使うのか、のデザイン思考やUXも大事です。

3. 結局必要な知識は?

右脳と左脳のいいところをつかんで、データ分析に落とし込むのが、求められているのかなと思います。

レイアウトをつくるだけでも、データの理解が必須ですし、イメージを伝える言語能力も必要。

少しダラダラと書いてしまったので、必要だと思うことをここでまとめたいと思います。

・データ分析ツールをとにかく触って、機能を把握
・前処理はアウトプットを意識してやる
・ユーザをイメージして画面構成を考える(ペルソナ設定)


以上が、データ分析初心者が思ったことです。

やっと楽しくなってきたなと感じているので、スキルを積み重ねていきたいです。

楽しくなるまでが苦しいけれど、楽しくなってきたら最強。


あなたの、今楽しくなってきたことは何でしょうか?

スキやコメント、フォローをくださると大変嬉しいです✨