見出し画像

データ分析とは、ビジネスの意思決定のクォリティを上げるために行う一連のプロセスのこと

データ分析を行う際になぜ行うのかの目的を設定することはとても重要です。データがあるからといって新たな知見を得られるだろうと過度な期待をして始めてはいけません。
データありきの分析は体験談としても失敗するケースが多いです。
具体的にどのような課題がありその課題を解決するために行いましょう。

この記事は次のような方をターゲットにしています。

・データアナリスト、データサイエンティストを目指している方
・これからデータ分析業務を行う方
・データ分析を失敗しないコツが知りたい

目的を設定する理由について

データ分析のプロセスでは一番最初に目的を設定します。

なぜ目的を設定するかというと、分析結果を意思決定者にレポーティングすると「それはすでに知っている」や「他の観点からの情報が知りたかった」など意識の相違が発生する可能性があるからです。

そうなってしまう前に意思決定者と事前に話し合いをしてデータの取り扱い方法のルール設定や、データ分析で解決したい課題を設定しておきましょう。

例えば、

・集客が以前よりも減っているのでその理由が知りたい。
・売上を伸ばすのか、コストを削減するのかどちらを優先すべきか知りたい。
・売上前年比◯%を達成するためにどのような施策を実施すればいいのか知りたい。

などです。

意思決定者が達成したいと思っている目標や、現在解決しようと取り組んでいる課題についてデータ分析者も十分に理解しておく必要があります。

事前に取り決めしておきたい内容について

工数について

データ分析では、前処理と呼ばれるプロセスに大きな時間を消費します。
これは前もって理由を話しておきましょう。
基本的にはスケジュールを立てて管理しつつ作業に取り組むので問題ないと思いますが、事前に認識を合わせておいたほうがお互いのためになる場合もあります。
ビジネス側と分析者側で認識の相違がある場合はかなりのリスクとなります。
特に最近データ分析を始めたといった会社は要注意です。

後から

「なぜこんなに工数がかかったのか?」
「もっと分析自体に工数をかけて欲しい。」

と言われてもすでに遅いです。
そうならないための予防策として先に取り決めておくことをお勧めします。

データの取り扱いについて

欠損値の取り扱いについては削除をするのか平均で埋めるのかなど
事前に取り決めておいた方が良いです、欠損値の扱い方で次のプロセスに影響が出ますので早めに決めておきましょう。

外れ値の取り扱いについても事前に取り決めておきましょう。
どこからどこまでを外れ値として除外するのか、外れ値は含めていいのか、削除するのか確認しておきましょう。
後にレポーティングする際に、突っ込まれてしまいやり直しが発生するリスクを軽減できます。

前処理はデータ分析の80%を占めると業界では通説ですが、意思決定者と密にコミュニケーションを取っておけば防げることが多いです。

最後に

データ分析を行う前に意思決定者と十分なコミュニケーションを取って
失敗のリスクを軽減する方法について解説しました。
AIや機械学習、データ分析は一種のブームになっており、取り組む企業が増えてきてデータ分析担当者となる日に向けて学んでおきましょう。


サポートよろしくお願いします。いただいたサポート費用は活動に役立てさせていただきます。