見出し画像

データ分析初心者向けおすすめ本のご紹介 〜第1弾・データ分析基礎力編〜

こんにちは。メルカリ Analyticsチームの @suwachan です。

この記事から何回かに分けて、メルカリ Analyticsチームのメンバーによる、「データ分析初心者の方におすすめの本」を紹介していきたいと思います。

駆け出しのデータアナリストの方だけでなく、PM・マーケターなどでデータ分析を学びたい方や、データアナリストと仕事をする方にもお役立ちできるような記事にしていく予定です。

第1段の今回は「データ分析基礎力」に関する本の紹介です。おすすめの本を @hizaさん、@Tsugutoさんに聞いてみました。

<編集後記>
本記事を書くにあたって、なるべく「どのような課題感があるときに読むべきか」と「この本によって、何がどう変わったのか」を具体的に解説するようにしました。
本を効果的に読むには、読む人のレベルに合ったものを選ぶこと、そしてその本によって何を身に付けるのかという目的意識を持つこと、この2点が大事だと考えているからです。
ご自身の課題意識とマッチし、その課題を解決できるような本をご紹介できたら幸いです。

相関と因果を区別する

分析の目的は「未来を変えるために因果関係を突き止めること」だという見方があります (定量分析の教科書より) 。しかし、その「因果関係を突き止める」までには、いくつもの罠があります。「因果関係だと思っていたものが、疑似相関でしかなく、施策を打っても何も変わらなかった」「2つの指標の間に相関があるのは分かったが、どちらが原因なのか分からない」……というような罠です。データ分析を始めた当初は、必ず誰もが通る道です。ここで紹介する2冊は、「相関と因果の違いとは何か」「データ分析で相関ではなく『因果』を突き止めるには、どうしたらよいのか」を教えてくれます。

1. データ分析の力 因果関係に迫る思考法


@Tsugutoさんがおすすめする本がこちら。Tsugutoさんはリサーチ会社に新卒入社し2〜3年経った頃にこの本を読んだそうです。当時のことを Tsuguto さんに聞きました。

Q: この本を読んだきっかけは何でしたか?
Tsugutoさん:
この本が出てすぐ、当時Twitterでフォローしていたデータサイエンティストの方や大学の先生の間で話題になっていたのがきっかけでした。

Q: この本を読んだ当時、どんな課題を感じていらっしゃったのでしょうか?  その課題は、この本を読むことによって解決できましたか?
Tsugutoさん:
レポートを書くときなど、因果と相関を区別するのが重要です。しかし、この事象は相関なのか因果なのか、分からなくなることがありました。この本は、相関と因果の違いや、因果関係を明らかにするアプローチが、とても分かりやすく書かれています。RCTやパネルデータ分析などですね。
また、ベテランの研究者の方がパネルデータ分析をしているのを見ていて、「なぜこんなに複雑な手続きを踏むのだろう?」と疑問に思っていたんです。この本を読んで、介入効果を測るときには、適切な手続きを踏まないといけないのだなと腑に落ちました。

Q: この本を読むことによって、業務に何か変化はありましたか?
Tsugutoさん:
ありました。広告の効果測定のプロダクトを開発していたとき、「ターゲティング広告の介入効果を測定するためにはどうしたらよいか」を考えていました。最初に想定していた手法は、ターゲティング広告に「接触した人」と「接触していない人」を分けて比較し、意識変容があったかを見る、というものでした。しかし、ターゲティング広告の場合、接触者と非接触者で性質が違います。その比較って比較ではないよね、ということを気付かせてくれたのが、この「データ分析の力 因果関係に迫る思考法」でした。

Q: どんな課題を持っている人におすすめですか?
Tsugutoさん:
データアナリストでない職種の人にも読んでほしいですね。分析の設計やアナリストが行うアプローチが理解できるようになると思います。たとえば「なぜこんな複雑な手続きを踏まないといけないの?」といったようなことです。
また、僕は専門的な因果推論の本を読む前に、この本を読み返して概要をつかむようにしています。因果推論の専門書を読む前にもおすすめですね。

2. 「原因と結果」の経済学

続いて、@hiza さんがおすすめする本がこちらです。

Q: この本を読んだきっかけは何でしたか?
hizaさん:
この本が出版されて話題になったときにこの本を知りました。以前から因果関係を明らかにする方法に興味を持っていたので読んでみました。

Q: この本を読んだ当時、どんな課題を感じていらっしゃったのでしょうか?  その課題は、この本を読むことによって解決できましたか?
hizaさん:
当時は「A/Bテストが出来ない状況でも因果を明らかにしたい」という課題を感じていました。この本や類書を読むことによって「そういうことは基本的には難しい」と理解でき、ある意味で課題は解決しました。データから因果を明らかにする手法はいろいろありますが、それらを適用するには前提条件を満たしている必要があります。実務上で知りたいことが、因果を明らかにできる前提条件を満たしていることはなかなかありません。それよりも、因果を明らかにするのは難しいことを前提とした上で何をすべきか考える方がよいと思うようになりました。

Q: この本を読むことによって、業務に何か変化はありましたか?
hizaさん:
「因果関係をデータで明らかにする難しさ」を理解したことで変化が生まれました。
1つ目の変化は、「因果関係が (少なくとも簡単には) データから分からないとしたら、データ分析が事業に対して行える貢献とは何か?」という観点が生まれたことです。モニタリングを行ってサービスの変化に気付くことや、施策の効果をシミュレーションしてインパクトを見積もることなど、因果が分からなくてもできる貢献を重視するようになりました。
2つ目の変化は、「因果を明らかにできる貴重な機会であるA/Bテストの品質をどうやったら高めることができるか?」を考えるようになったことです。例えば Experiment design doc というA/Bテストの設計ドキュメントを改善していく取り組みを行っています。(参考: メルカリにおけるA/Bテスト標準化への取り組み)

3つ目の変化は、UXリサーチなどデータ分析以外の手法も取り入れるようになったことです。 (参考: UXリサーチを活用して、仮説検証プロセスを改善した話)

Q: どんな課題を持っている人におすすめですか?
hizaさん:
相関と因果の違いはデータを扱う上で重要なポイントなので、分析を行う方全員におすすめですね。さらに「分析を依頼する人」にもおすすめです。因果を明らかにすることの難しさを感じていただけますし、読みやすいからです。

<編集後記>
Tsugutoさんが言っているように、相関と因果を区別した上で、因果関係特定の手法を知らないと、「なぜこのように複雑な手続きを踏まないといけないのか」がなかなか納得できないと思います。一方でA/Bテストなどの実験はリソースが必要なので、実施の意思決定が難しいこともあるでしょう。因果関係を明らかにする難しさや、明らかにするための方法について、関係者全員で共通理解を持つことが重要ですね。

データ分析で事業に貢献する方法を学ぶ

データ分析は、「分析作業や分析結果そのもの」が事業の売上に直接つながるわけではありません (データ分析受託会社のように分析そのものが商材である場合を除きます) 。データ分析で得られた知見をもとに、何かしら行動を変えたり施策を打ったりすることにより、事業の売上が伸びていきます。そのように価値のあるデータ分析を行うためのヒントを得られる2冊をご紹介します。

3. データ解析の実務プロセス入門

まずご紹介するのは「データ解析の実務プロセス入門」。@hizaさんがソフトウェアエンジニアからデータアナリストに転向したときに読んだ本だそうです。

Q: この本を読んだ当時、どんな課題を感じていらっしゃったのでしょうか?  
hizaさん:
数年前にエンジニアからアナリストに転向してから、しばらくは周りのアナリストがやっていることを真似ながら我流で分析をしていました。しかし、体系的にデータ分析の知見を得たいなと思いこの本を読みました。

Q: その課題は、この本を読むことによって解決できましたか?
hizaさん:
データ解析のプロセスの全体像を再確認できて課題は解決しましたが、それ以上に勉強になったのは「良きデータ」というコンセプトを知れたことですね。
また、シンプルな分析を事業上の価値に繋げている事例が数多く紹介されている点も良かったです。

Q: この本を読むことによって、業務に何か変化はありましたか?
hizaさん:
ありました。まず「良きデータ」を手に入れるために、データが発生してから自分の手元に来るまでの過程をすべて把握しようとするようになりましたね。また、よりシンプルな分析方法で事業上の価値を生み出せる機会を積極的に探すようになりました。

Q: どんな課題を持っている人におすすめですか?
hizaさん:
できれば全員に読んでほしいのですが、特に分析を行う前後のプロセスへの理解を深めたい方におすすめですね。データ分析は、分析した結果が具体的な取り組みに繋がらなければ意味がありません。この本は、分析が価値につながるために必要なプロセスの全体像を説明してくれています。

4. 意思決定のための「分析の技術」

続いて、@Tsuguto さんのおすすめ本がこちらです。

Q: この本を読んだ当時、どんな課題を感じていらっしゃったのでしょうか?  
Tsugutoさん:
この本は、メルカリにデータアナリストとして入社する前に、改めて「分析とは」をおさえたいと思って読みました。この本はコンサルタントの方が書いた思考の方法についての本なのですが、「問題解決をする」という目的に対してはメルカリのデータアナリストも一緒なので、分析の考え方が整理され役に立ちました。

Q: その課題は、この本を読むことによって解決できましたか?
Tsugutoさん:
はい、「分析を使って意思決定をするとは何か」ということを学べました。意思決定のための分析手法 (考え方) が各章で整理してあり、全章を通じて読むことで、ビジネスのための分析の全体像が理解できました。

Q: この本を読むことによって、業務に何か変化はありましたか?
Tsugutoさん:
「問題解決のインパクトを重視する」「ソフトスキルも大事にする」というところですかね。インパクトについては、つい細かくユーザー群を切り分けて、違いが出るところを探しに行ったりしてしまいますが、インパクトがない意思決定には意味がないなと。「ソフトスキルが大事」ということについて。データだけ見ているのでは足りず、人に伝えて意思決定を促すのが大事だと、改めて学びました。

Q: どんな課題を持っている人におすすめですか?
Tsugutoさん:
問題発見・解決の思考法 という副題がまさに本書を表しているとおり、アナリストに限らず、どんな方が読まれても参考になると思いました (どのような職種の方でも、問題発見と解決を行っていると思うので) 。

メルカリのデータアナリストは問題解決が重視されますが、問題解決のためには、問題を適切に切り分けるロジカルシンキングが欠かせません。分析の手段や技術 (因果推論やアンケートの作り方など) はその上に乗ってくるものなので、まずはここを鍛えるのが大事だと思います。


今回、2人のデータアナリストから「データ分析の基礎力をつける本」について聞きました。
奇しくも、2人が共通して挙げていたのは「相関と因果を区別すること」と「分析を通してビジネスに貢献すること」を学べる2冊でした。

相関と因果の違いを区別することは、データを見て何らかの意味合いを抽出する上で、大前提となることなのだと改めて実感しました。
また、どんな職種であれ、「自分がどのようにビジネスに貢献していくのか」という振る舞い方を念頭に置いて行動することが大事だなと思いました。

第2弾は「データ分析設計力」に関する本をご紹介する予定です。ぜひ @mercari_data をフォローしてチェックしてください。お楽しみに。

▼採用情報サイト・関連記事はこちらから

この記事が気に入ったらサポートをしてみませんか?