初心者がデータ分析を勉強して思った、必要な○○スキル
データ分析やオープンデータをよく聞くようになりました。
データが溢れてきており、いろんなところからデータを持ってこれるようになっています。
そして、データエンジニアやデータアナリストの必要性も高まっています。
私はデータ分析を通してビジネスインサイトを得たいと考えています。
その目的のために、Tableauなどのツールを使ってデータ分析を勉強しています。
勉強していくなかで、これは身につけないとなと思ったスキルが3つあります。
1.データの前処理方法を統一する
前処理とは、データをインポートする前に整理することです。
データ分析ツールにインポートするためには、オープンデータでもそのまま入れては、効果的な分析になりません。
必要ない項目が入っていたり、逆に必要な項目がなかったりするからです。
すぐにインポート出来るぐらい整理されてるデータは、本当に限られています。
では、どうするかというと手作業でデータを入力するわけです。
自動化できれば楽なのですが、APIやPythonの知識が必要になったり。
自動化しても欲しいデータが得られなかったり。
結局手作業が確実で、人海戦術でやった方が逆に早いのです。
インポートするにも、型変換に注意したり、IDを付けたりなどが必要です。
ただ入れればいい訳では無いことを、実際にやってみて実感しました。
データを作るときに、部署間でテンプレートを定めたり、項目を統一したりできたら、その後の分析が楽になるなあと思います。
実際にツールを触ってみたとき、やっぱりこの項目いる!となったら、また時間がかかります。
出戻り発生は避けたいんですよ……
2. 分析結果をいかに「魅せるか」のデザイン思考やUX
やっと前処理が終わって、いよいよツールにインポートします。
そこで立ちふさがるのが、どんなグラフにしてどんな配置にして、何と何をリンクさせるのか、画面構成をどうするのか、のデザイン面です。
何と何を比較すれば、効果的なインサイトが得られるのか。
これとこれをセットにしたら、より重層的に分析できるか。
機械学習はどのデータを使ってやるのか。
レイアウトを考えるには、空間把握力というか、三次元を想像する力が必要だなと思うのです。
データ分析の向こう側にいるユーザがどう使うのか、のデザイン思考やUXも大事です。
3. 結局必要な知識は?
右脳と左脳のいいところをつかんで、データ分析に落とし込むのが、求められているのかなと思います。
レイアウトをつくるだけでも、データの理解が必須ですし、イメージを伝える言語能力も必要。
少しダラダラと書いてしまったので、必要だと思うことをここでまとめたいと思います。
・データ分析ツールをとにかく触って、機能を把握
・前処理はアウトプットを意識してやる
・ユーザをイメージして画面構成を考える(ペルソナ設定)
以上が、データ分析初心者が思ったことです。
やっと楽しくなってきたなと感じているので、スキルを積み重ねていきたいです。
楽しくなるまでが苦しいけれど、楽しくなってきたら最強。
あなたの、今楽しくなってきたことは何でしょうか?
スキやコメント、フォローをくださると大変嬉しいです✨