見出し画像

データ分析レポートを書くときに初心者が気をつけたいこと

この記事はビジネスにおいてデータ分析のレポートを作成する際に気をつけたほうがよいことを自分なりにまとめたものです。間違いやすい点なんかを集めたTIPSみたいな記事になっています。
レポートの書き方そのものについては良い書籍や記事がたくさんありますのでそちらを参照することをオススメします。

前提

データ分析のレポートでは基本構成としてIMRAD形式に則るのが良いです。
IMRADとはIntroduction, Methods, Results And Discussionの頭文字を取ったもので、特に論文でよく使われる構成です。
シンプルですが科学的検証に向いた形式でありデータ分析もデータを元に客観的に検証するという観点からIMRAD形式に合わせると適切に記述・検証することが可能になるので強く推奨です。
逆に言えば、ビジネスのプレゼンテーションにありがちなインパクトを優先する恣意的な印象を与える方法は基本的にはNGです。
一方で、ビジネスの現場では重要な点をすぐに把握できる形が好まれます。そのため記述する順番はIMRADに限る必要はありません。私がよくやる方法は抄録を冒頭に置いてそれだけで要点をすぐに把握できるようにし、詳しく読みたい人向けに後ろにIMRAD形式で記述する方法です。目的と結論、最低限の手法や議論などを要約とすると良いでしょう。

Introduction

この章では分析の目的・背景を記述します。あなたが何を目的にこの分析を行い、何を得たいのか明確にわかるように書きましょう
目的や背景を書くときに重要なことは、データ分析では分析の結果からどんな結果を得たいのか記述することです。これがなければ分析の意味がないので当然ながら重要な事柄になります。データ分析の目的は抽象化すると下記の3パターンにわけられます。

1. 仮説をデータから検証する
2. 変化を検知するために定常的なデータを取得する
3. 数字感覚を知るために探索的分析をする

手元の分析が上記のどれに当てはまるのか分類し、それを踏まえて記述するとよいでしょう。たとえば、あなたが1番の仮説検証を行いたいのであれば、どんな仮説があり・どんな検証が必要で・その結果としてどんな判断をとることができるのか書くことになります。
背景を記述する際に気をつける点として、その分析を今行うことが妥当であることを明記することが挙げられます。それっぽく言うならイシューとして正しいことの説明です。分析を行うまでには様々な背景や先行調査などがあるかと思いますが、それらを記載することで今からレポーティングする分析が妥当であることを説明する必要があります。これを怠るとレポートを読んだ人の視点では「もっと先に分析すべきことがあるのでは?」という疑問が解消されません。この分析の結果は他の分析によって簡単に覆るものではないという説明が必要になるのです。

Method

この章では分析の対象や手法をすべて記載します。あなたがどこからデータを取得してきてどのように分析したのかわかり、再現できるようにしましょう。
基本として書くべきことは母集団の説明、データの取得方法(クエリやアンケート方法)、分析方法(特に統計的手法)です。
ありがちなのが母集団に関する説明の不足です。データをどのような母集団から得たのか明記しましょう。データは取得した母集団によってバイアスを受けるため、バイアスに留意した記述が必要になります。記述の基本は5W1Hを用いた方法です。ビジネスの現場では特定の属性を対象にデータを集めることが多いと思うので、そのような事前に決めていた属性は網羅的に記述します。
データの取得方法はアクティビティなどをデータベースから取得した場合は意図的に絞り込んだ条件の記載とクエリ、可能であれば生データを共有しておくと一番よいです。アンケートなど能動的にデータを取りに行った場合はいつ、どこで、どのようにして実施したのかなど可能な限り詳細にアンケート方法を記載しておくとよいでしょう。アンケートは様々な理由からバイアスが発生しうるので、なるべく詳細に実施内容を書いておくと良いです。どちらの手法にせよ、他の人が同じようにデータを取得できるレベルに記載しておくことが望ましいです。
分析方法は集計以上に統計的手法を用いた場合は明記しておくとよいです。統計的手法はいくらでも嘘の結論を導くことができるのでどんな手法を選んだのか明確に記述するべきです。とはいえ、そもそもレポートの書き方がままならないレベルの人は統計的手法を使わないほうが望ましいです。理解していない技術を使うことは思わぬ失敗を招きます。必要ならば専門家と共同して行うべきでしょう。

Results and Discussion

この章では分析から得られた結果とその考察を記載します。あなたが分析から得られたデータや統計的解析結果とそれに対する考察を書きます。
結果と考察の項を書くときに最も重要なことは客観的事実と自分の考えを明確にわけて書くことです。データ分析はデータという客観的な情報を元に意思決定することを目的としています。にもかかわらず、あなたの主観と客観的情報を混ぜて書いてしまってはその価値は失われてしまうでしょう。
レポートを書く際にグラフを使うことがとても多いと思いますが、グラフの描き方には一定のルールがあります。このルールはそれを守ることによってグラフを見た人が誤解をせず適切にグラフから情報を読み取れるようにするためのものです。ぜひ下記だけでも最低限は守りましょう。というかこれが守られてないグラフは知らない人からみたら何を示しているグラフなのかわからないです。

1. 3Dグラフは使わない
2. データにふさわしいグラフを使う
3. グラフの各軸の名前と単位、説明を付ける

統計学的手法を用いている場合はその結論を導いて良いのか適切に検討しましょう。例えば、相関関係と因果関係を見誤ることはとても多い問題です。他にも検定の結果の受け方は一癖あるので手法を理解し記述するよう気をつけるべきです。これを間違うと一気にレポートの信頼性が落ちてしまいます。
また、バイアスの存在を忘れないようにしましょう。データは常に何かしらのバイアスの影響を受けています。結論に影響がなくても影響が無いことを明記すべきです。バイアスについて留意した考察を行うことを行ったということが重要になります。

あとがき

このnoteではデータ分析を行ったときのレポーティングについて簡単に述べさせていただきました。もちろん、これらを常に記載することは労力がかかるため自明であればすべてを記載する必要がないこともあります。ベテランがこれらのいくつかを書かないことはたまにありますが、それは理解した上での手抜きであり、初心者のうちはこれらすべてを明確に書くことを意識するべきだと考えています。
この記事をとおして、あなたのレポートが良いものになれば嬉しい限りです。

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

役にたったらシェアしていただけると嬉しいです
136
某Fintech企業の人工知能の中の人。 データ分析・機械学習・データサイエンス・金融工学…etc Twitterのフォローもどうぞ! https://twitter.com/grahamian2317 ※アイコンは架空の人物です→ http://generated.photos

この記事が入っているマガジン

データ分析をする前に読むマガジン
データ分析をする前に読むマガジン
  • 4本

データ分析をしなければいけなくなったけどそういう教育や訓練を受けていない人に向けたnoteをまとめたマガジンです。 統計とか機械学習とかそういう技術以前のもっと初歩的な話を中心に扱っています。

コメントを投稿するには、 ログイン または 会員登録 をする必要があります。