【読書メモ】定量分析の教科書ビジネス数字力養成講座

2023年3月27日 09:55

グロービズ経営大学院教授鈴木健一さんの『定量分析の教科書ビジネス数字力養成講座』読んでみました。

"定量分析"という骨太なテーマを扱う本書ですが、文章は読みやすく、内容が頭にスッと入ってくる感覚があり、楽しく読み終えることができました。（ちゃんと学べたか不安）

引用されている偉人・事業家の言葉は素敵なものが多く、定量分析に関連した事例を通して、新しい世界の様相を見た気になれました。良い読後感。

今回は特に興味深いと思った内容をまとめてみようと思います。

1.数字にまつわる偉人の言葉

本書では国内外の偉人の言葉が引用されています。経営や事業にとって数字がどのような意味を持つのか？理解できるような名言が多かったです。

「世の中には 3種類の噓がある──噓、大噓、そして統計だ」　
“ There are three kinds of lies: lies, damned lies, and statistics.”　

小説家マーク・トウェイン

「数字は噓をつかない。噓つきが数字を（噓に）使う」
“ Figures don' t lie, but liars figure.”

小説家マーク・トウェイン

「会計の数字は飛行機の操縦席にあるメーターみたいなもの。実態を表していなければ正しい方向に操縦はできない」

　稲盛和夫

「正確な日時や金額など、数字の入っていない会話は、ビジネスの会話ではありません。それは遊びです」

ニトリ似鳥昭雄

「問題には必ず原因があります。また、数字は正直です。原因や数字を現実と踏まえることで、必ず対策が見えてきます」

エイチ・アイ・エス澤田秀雄

「数字なき物語も、物語なき数字も意味はない。
　　　　　　　　　　　　　　　　　　　　　　目標を数字で表現すると、その数字の実現に何をどうすればいいのか、誰がどのような筋書きでどのような仕事をし、それにはどんな場面が必要なのか、方法論としての物語が浮かび上がってくる。　　　　　　　　　　　　　　　　　　　　　　　　数字なき物語も、物語なき数字も意味はなく、実行も達成もできないでしょう。数字とその実現を約束する物語を示すことで、経営計画の信憑性を高め、市場や株主からの信頼性を確保する。数字力が言葉に信の力を与える

キヤノン御手洗冨士夫

「もしあなたが簡単に説明することができないのなら、あなたは十分にわかっていないということです」“ If you can' t explain it simply, you don' t understand it well enough.”

アインシュタイン

2.分析の本質とは？

分析の本質は比較
数字を使った分析の本質は「比較」。「比較をしない分析はない」といっても過言ではない。

比較をすることで数字という原石から意味を抽出するのが分析。普段行っている分析も、その多くは無意識のうちに何かを比較している。

何を比較しているのか、比較対象を意識するだけでも、分析ははるかにシャープになる。

そもそもビジネスにおいて何のために分析をするのか？
ビジネスの本質とは「因果関係の構築」。

ビジネスでは通常、期待成果や目的があって、
それを実現するためにいろいろな行動、アクションをとっていく。

そしてこの際、どのようなアクションをとれば効率的、かつ効果的に成果が出せるのかに日々頭を悩ませている。

アクションによって期待される成果が出るためには、アクションと期待成果の間に因果関係が不可欠。

仮にこの因果関係が不明なアクションをとるとしたら、アクションは、ほぼ「おまじない」と同じレベルと言ってもよい。

違った表現をすれば、「因果関係がわかれば未来を変えられる」と言ってもよい。我々は未来を変えるために仕事をしている。

問題解決と比較
まず、問題とは「現状とあるべき姿にギャップがある状態」と捉える。

リーダーの大切な役割の1つは目標を設定することにありますが、問題の定義に即して考えれば、目標というあるべき姿を設定することで「問題を作ること」がリーダーの役割。

問題解決は因果関係そのもの
ビジネスにおいて因果関係を具体的に考える例示として、問題解決によく使われる、汎用性の高い問いフレームワークであるWhat‐ Where‐ Why‐ How。

① What……そもそも取り組むべき問題（あるべき姿と現実のギャップ）は何だろう？

② Where……どこに問題があるのだろう？

③ Why……なぜ問題が起きているのだろう？

④ How……解決策は何だろう？

この 4つの問いのうち、最初の 3つの問いに答えるには「比較」が不可欠。

まず、問題点の所在を明らかにする Whatでは、通常あるべき姿と現状のギャップで問題を定義するが、これはまさに比較。

続く、問題や対象を絞り込む Whereと原因を明らかにする Whyに答えるためにも「比較」が不可欠。他の部分と比較をすることで
初めてどこに問題があるのか、また、原因と結果の比較をして関係性を見ることで、初めて問題の原因が見えてくる。

適切な比較とは
英語では、よく比較対象が適切かどうかを「リンゴとリンゴを比べているか（ apples to apples）」、間違って「リンゴとオレンジを比べていないか（ apples to oranges）」と表現する。

ビジネスにおける実験とA/Bテスト
A/Bテストの例として、2012年の米大統領選挙でオバマ陣営の使った分析が本書で紹介されている。

オバマ陣営では2008年の大統領選挙に引き続き、2012年の大統領選挙でもA/Bテストを駆使して、寄付の獲得を図った。

図表1‐12の写真はモバイルサイトでは、当初、サイトはできる限りシンプルなほうがよいだろうとの仮説の下、左のように、オバマ大統領の写真を外してた。しかし、A/Bテストでオバマ夫妻の写真が入ったサイトとの比較をしたところ、写真があるサイトのほうが6.9％ほど寄付は多かった。

オバマ陣営では 2012年の選挙戦ではこのようなA/Bテストを500回実施してサイトの最適化を図ったとされている。

分析=仮説思考×比較
効率的に分析するには特有の頭の使い方、
思考ステップ（仮説思考）が必要になる。

やみくもに分析するのではなく、分析によって何を解き明かそうとするのか、どんなことが言えるとよいのかをあらかじめ想定してから実際に分析に取りかかる。

「分析＝仮説思考 ×比較」とシンプルに捉えることが可能。

3.仮説と分析思考

仮説とは？
仮説＝（問いに対する）仮の答え／ストーリー。

多くの人が仕事に取りかかる前に多かれ少なかれ事前に自分のストーリー、すなわち「仮説」を持って単なる試行錯誤だけではなく、意図を持って仕事をしているはずです。

仮説思考のメリット
メリットは3つ。

仮説思考の仕事のメリット＝スピード ↑ ×精度（質） ↑ ×進化スピード ↑

仮説を持たないで仕事をする、ということは言い換えると行き当たりばったりで仕事を進める、ということになる。

時間が無限にあればこの方法でもいつか答えに行き着けるかもしれない。しかし、ビジネスでは常に限られた時間で結果を出すことが求めらる。

仮説を持って仕事をすることのメリットは、試行錯誤による余計な作業をしなくてもよい、したがって、スピーディかつ集中して精度の良い仕事ができること。

実は仮説を持って仕事をしている場合と持っていない場合とで違いが出るのは、まさに「外れた」場合。

仮説を持たずに仕事をした場合、目の前の事実をそのまま受け止め、「なんだ、そうなるんだ」と納得してしまい、「なぜ？」と問うことなく終わってしまう。

仮説を持っていると、意に反して仮説とは異なる結果になった場合、他人に言われなくても仮説のどこが間違っていたのか、「なぜ？」と自分に問わずにはいられない。仮説のとおりにならなかったということは、そこには自分が考えきれなかった「何か」が潜んでいるはず。

仮説を持って毎日仕事をすることの365日の積み重ねが1年後にあなたの仕事の精度、質にどのような変化をもたらすかは言うまでもない。

別の言い方をすれば、あなたは仮説起点で仕事をしたことで、仮説が外れた経験から「学べた」ことになる。

次に考えがつながるか、進化するかどうかが仮説を持って仕事をするか否かの大きな違いになる。仮説を持たなかった場合、おそらく次回も同じように仕事をしてしまう。

仮説思考のステップ
ステップは下記に分けられる。

・ステップ 0
目的（イシュー、問い）を押さえる

・ステップ 1
目的（問い）に対する仮説（ストーリー）を立てる

・ステップ 2
実際にデータを集める

・ステップ 3
分析により仮説のとおりかどうかを検証し、確かめる

このステップのうち、特に大事なのは最初の 2つ、「目的（問い）を押さえる」と「仮説を立てる」の 2ステップになる。

ビジネスにおいて重要な「使える」仮説＝アクションにつながるもの
「使える」仮説、「アクションにつながる」仮説とは、因果関係（原因、手段 →目的、結果）に関連するメッセージでなければならない。

「使える」仮説の多くは因果関係そのものに関するもので、「これをするとこうなる（Why?）」といったものか、あるいは、
「80対20のルール」に代表されるような「ここに絞り込むと効率的に結果が出せる（Where?）」といった、その仮説によって、実は効率的に因果関係が作れるといったものになります。

問いのパターン
まず、何が問題（イシュー）なのか、何を解決すべきなのか、問題そのものを明確にする問い（What?）と、明らかになった問題を具体的に解決するための、問題解決の問い（ Where? Why? How?）に分けられる。

より幅広く、あるべき状態と現状にギャップのある状態を「問題」のある状態、さらにこのギャップを埋めて、あるべき状態を実現することを「問題解決」と捉える。

問題を幅広く捉えると、ビジネスにおける戦略や経営計画をはじめとして、皆さんが取り組むことの大半をある種の「問題」として捉えることができる。

というのも、あるべき姿を「目標」と捉えてやると、日々目標に向かってアクションを起こしていくほとんどのビジネス文脈を問題と読み替えることができる。

もうひとつの問いのパターン PICO
問題解決のフレームワークとして、「 What → Where → Why → How」という枠組みをさきほど紹介したが、左記以外にも、特にWhyにかかわる分析を意識したときに役立つ枠組みがある。

因果関係を意識し、仮説をどのように分析したらよいかを考える際に、そもそも仮説の表現の定式化としてもヒントになる枠組み。

・Ｐ（問題 Problem）
対象は何、誰？（医療の文脈では患者、 Patient）

・Ｉ（原因 Intervention）
何をすると？（Ｉの代わりに Exposureの Eを使うことも）

・Ｃ（比較 Comparison）
何と比べて？

・Ｏ（結果 Outcome）
結果はどうなる

比較対象も含め、上記枠組みで表現されていれば、後はどのようなグラフで分析すればよいのかは、かなりイメージしやすくなる。

逆に、この4要素がしっかり入っていない仮説は分析して表現するのは難しい、といってもよいかもしれない。

仮説構築力──仮説はどのように生み出せばよいのか
仮説構築力、仮説構築の推進力の源は、「問題意識」と仮説の「引き出し」に分けて考えることができます。

仮説構築力＝問題意識 ×引き出し

仮説を構築する推進力としての仕事への問題意識と、仮説のタネとなる知識や情報の引き出しの2つがあって初めてビジネスで「使える」仮説が生み出せるのです。

【問題意識】
日々、どれだけの目的意識、問題意識（もっとこうしたい、このままではまずい）を持って仕事に取り組んでいるかが仮説構築のスタート地点。

明日も今日と全く同じように仕事をすればよいのであれば、おそらく仮説構築自体、ほとんど必要ないかもしれません。

もっと良い仕事がしたい、未来を変えたい、こういった問題意識があってこそ、初めて仮説構築の意味が生まれますし、「なぜこうなるのだろう？」という疑問も湧き、仮説を立ててみようという前向きのエネルギーも生まれるもの。

問題意識を持って仕事をしていると、面白いことに氾濫する情報の中から仮説のタネとなる関連する知識、情報が自然と自分の目や耳に飛び込んでくるもの。

【引き出し──ビジネスのメカニズムへの理解】
ロングセラーとなっている、『アイデアのつくり方』には「アイデアとは既存の要素の新しい組合せ以外の何ものでもない（“ An idea is nothing more nor less than a new combination of old elements”）」と記述されている。

今、アイディアを仮説と読み替えれば、まさに「仮説とは既存の要素（知識）の新しい組合せ以外の何ものでもない」と捉えることができる。

ゼロを何倍してもゼロにしかならないように、仮説のもととなるビジネスのメカニズム、因果関係に関する原理原則の知識、引き出しが全くない状態では初期仮説すら立てることができない。

極端なことを言うと、いくら演繹法や帰納法といった論理思考の方法を学んだとしても、知識がなければ仮説は生み出すことができない。

仮説の引き出し＝知識（経験から得た知識＋学習で得た知識）＋情報

仮説のタネとなる引き出しには知識と情報という、大きく2種類のデータソースがありある。

知識のうち、まず最も大切なものは仕事をはじめとする自分の経験から得られた知識。日々の経験は「こうしたら、こうなった」という知識の形で蓄積されていく。

経験は自らが体験したことですので、データベースに最も深く刻み込まれることになる。成人の能力開発の7割は経験で説明できるといわれることがありますが、引き出しの知識の多くも、やはり経験から得られたものとなる。

一方、経験から得られる知識は経験できることしか学べない、すなわちその幅と深さが業務で経験できることで限定されてしまう、なかなか全体感が持てない、構造化ができないという大きな限界を持っている。

この経験を補うのが、たとえばビジネスであれば、ビジネススクールなどの場で体系的に学ぶことによって培われる知識になる。

4.データ収集の考え方

データ収集の目的
データ収集の主たる目的は以下の2つです。

・事前に作った「仮説」を検証する
→仮説検証型

・そもそも「仮説」を作る
→仮説探索型

実際にデータを集めに行く
データの集め方を大別すると、以下の2通りです。

5.分析の5つの視点（比較の軸）

分析では比較軸を揃えて比較することで、そこに意味合いを見出すことになる。ということは、データのどこに目をつけて比較するかが大切になる。

分析の目のつけどころ、すなわち分析の視点を、主に何を比較対象にするのか、は大きく5つある。

①インパクト　⇒　大きさは？
②ギャップ　　⇒　差異は？
③トレンド　　⇒　変化は？
④ばらつき　　⇒　分布は？
⑤パターン　　⇒　法則は？

【1】インパクト（大きさ）
最初の視点は、分析対象のインパクトの大きさ、つまり「分析が最終的な結果に及ぼす影響度の大きさ」を考えるということ。

影響度に応じた分析結果の精度、分析方法を選択することになる。これはつまり、「そもそもその分析、時間と手間をかけてやる意味あるの？」という問いに答えられるかどうかということ。

【2】ギャップ（差異）
「ギャップ」とは、一般的な分析対象を比較することを通じて、分析対象と比較対象の差異、すなわち「何が『同じ』」で、「何はどのように『違う』のか」を認識し、また、なぜ「同じ」なのか、あるいは「違う」のかを考えることで分析対象固有の特徴を理解すること。

適切な比較対象を選ぶ際には、たとえば以下の比較軸を参考にしてみる。

絶対値を使うのか、比率（％）を使うのか
たとえば、「外国に比べて、日本の公務員は多すぎる」という仮説を検証する際に、公務員の人数そのものを使うのか、それとも、働く人当たりの公務員の比率（公務員数÷総労働者数）を見るのかによって、分析の意味合いが変わってくる。

フローを見るのか、ストックを見るのか
一般に、ある一定期間内に流れた量をフロー、ある一時点において貯蔵されている量をストックと呼ぶ。

たとえば経済的な豊かさを比較する際、フローである収入とストックである資産保有額の 2つの方法が考えられる。

企業の財務会計では収支を表す損益計算書がフロー、貸借対照表がストックに対応する。

【3】トレンド（時間的な変化）
「トレンド」は過去、現在、未来へと時間軸での比較をすることで変化を捉える視点。

トレンドでは過去の時間的な変化を見ることで、将来を予測する。

過去のトレンドから、データで見ている現象にどのような力が働いているのかを考えるヒントを得て、必要なアクションにつなげる。

ドイツ帝国の首相だったビスマルクは、「愚者は経験に学び、賢者は歴史に学ぶ」と語ったが、トレンドは大げさに言うとデータの時間的変化、歴史に学ぶということになる。未来のヒントは過去にある、と言ってもよい。

それでは時間的な変化のどのような点にヒントを得るのか。主として見るべきポイントは2つにまとめられます。

・トレンド（一貫した傾向）
・傾向からの乖離
　・変曲点（傾向が変わる点）
　・外れ値（傾向から乖離している点）

変曲点（傾向が大きく変化する点）や外れ値（傾向から乖離している点）は、背景となる構造の変化や、想定外の特異な力が働いていることを示唆しており、考えるヒントという意味でとても重要。

ここでも変曲点や外れ値を見たら必ず「なぜ？」を考えることが大切になる。

【4】ばらつき（分布）
ビジネスにおいて、使える資源や時間が限られていることから、物事を重要なものから処理する、あるいは施策に対する感度の大きいものから手をつけることは非常に重要。偏りに着眼することは、こうした優先順位づけに大いに役立つ。

【備考】ジップの法則
世の中の多くの現象は「偏る」が、どのように偏るかについていくつかの法則が知られている。

たとえば、ジップの法則（ Zipf' s law）。もともとは名前の由来ともなった、ハーバード大学の言語学者だったジョージ・キングズリー・ジップが見出した英単語の出現頻度に関するパターン（ k番目に多い単語の出現頻度は 1番多い単語の 1/ kである）に起因。

社会現象を中心として「世の中は偏る」ことを指す法則としてよく名前を聞くものにはジップの法則以外にも、先ほど触れた「パレートの法則」や「べき乗則」というものがあるが、実はこの3つは同じ現象を指している。

【5】パターン（法則）
分析対象間の関係性を比較することで、潜む「パターン（法則性）」と、それから外れる「外れ値」、および傾向が大きく変わる「変曲点」を見つけることがパターンの視点。下記はそれぞれのポイント。

パターンを見つける
法則を見つけるとは、「Aという特性があると、 ○○になる」「Aが多ければ多いほど、 △△になる」という傾向やルールを見つけることを意味する。「相関」は、まさにこの法則の最たるもの。

外れ値を見つける
外れ値を見つけるとは、「ルールやパターンとは異なる特徴を示す要素を見つけること」。

外れ値に着目するメリットは、外れ値自体に、実は事前に予測できなかったビジネスチャンスが潜んでいるので、外れ値発生のメカニズムを解き明かすことで、想定していなかったビジネスのヒントを得ることができるということ。

変曲点を見つける
変曲点を見つけるとは、「これまで観察された法則性とは違う法則が見られ始める、急激な変化のポイントを見つけること」。ここでは一般に呼ばれているクリティカルマス、臨界点という考え方とほぼ同じ意味。

6.比較の技術

データの種類と分類
前提となる、データ種類と分類を整理。
（データの種類と分析のアプローチ（できること、できないこと）は密接に関連している）。

次の表のとおり、量的データは、比率データ、間隔データともに平均値、標準偏差などの計算はできるため、取扱い上はその違いをあまり意識しなくてもOK。

目で見て「比較」してみる
分析でデータを比較するには、データを集約して比較しなければならない。

まず目で見る方法、すなわちグラフによる分析。

人間は外界から得る情報の約 80％を目を使った視覚情報に頼っているといわれています。人間は「目で見る」動物。

実際、研究者の試算によると、人間の網膜から脳に送られる情報量は毎秒10Mビットとされており、これはほぼ、新聞紙50ページの情報量に相当する。

目は膨大な量の情報を処理している。この毎秒10Mビットというスピードは、オフィスや家庭で使われている LANと呼ばれるコンピューターネットワークの規格スピードに匹敵する。

このような大量の視覚情報を処理することに長けている私たちの目と脳を分析に使わない手はない。

グラフは言語である
数字はそのままではうまく「比較」できない。
簡単に比較するための最強のツールがグラフ。

目の情報処理能力はきわめて高く、グラフでデータを可視化することでデータのさまざまな関係性を簡単に理解することができる。グラフを
大いに活用する。

図表4‐2の仮説構築力のステップ、「分析で仮説を確かめる」という視点からは、グラフから何が読み取れるか（解釈）以上に、仮説（ストーリー）をどのようにグラフに翻訳すればよいのかが大切になる。

グラフ化の3つのステップ
下記の3ステップ。

比較対象とよく使われるグラフの対応関係
実はよく使われるグラフのパターンは、皆さんがよくご存じの円グラフ、棒グラフ、折れ線グラフをはじめとして、それほど多くない。

すなわち、グラフの種類を新たに覚えることよりも、何を比較すればよいのかを明確に意識して知っているグラフを活用することのほうが大切。

トレンドを見る際の注意点
トレンドを見る際には、直近のトレンドを見る虫の目と、出来る限り長期のトレンドを見る鳥の目の 2つの視点が大切。

これに関して、終戦の詔勅の作成に関与した陽明学者の安岡正篤は物事の本質をつかむコツとして、次の 3つのポイントを掲げている。

①目先に捉われないで、できるだけ長い目で見る

②物事の一面に捉われないで、できるだけ多面的に、できれば全面的に見る

③何事によらず枝葉末節に捉われず、根本的に考える

7.数字に集約して「比較」してみる

数字への集約には大別すると、次の 2つの視点があり、ここをまず押さえられれば、おおむねデータの全体像の様子がイメージできる。

①データの中心はどこにあるか（代表値）

②データはどのように散らばっているか（散らばり）

このうち、代表値はまさにその名のとおり、データの中の代表的な値、代表選手は何か？というもの。

日本語では代表値と呼ばれているが、英語では measure of central tendency（中心的な傾向の目安）、あるいは measure of central location（中心の位置の目安）と、より説明的な名前で呼ばれており、データの中心的な値は何だろうか、という指標を指している。

【1】データの中心はどこにあるのか（代表値）
平均にはよく利用される単純平均、加重平均の 2種類に加え、年平均成長率の計算に多用される幾何平均がある。

1‐ 1.単純平均、加重平均
単純平均に対し、加重平均とは、データの数値に何らかの重み付け（ウェイト）を掛け合わせ、その掛け合わせた数値の合計を、ウェイトを考慮した数で割った値。

1‐2.幾何平均（年平均成長率）
単純平均、加重平均に加え、ビジネスシーンでよく使われる「平均」に「年平均成長率（ CAGR: compound annual growth rate）」や「年平均利回り」がある。これは単純平均のように各年の成長率（利回り）を足して年数で割ったものではない。幾何平均という考え方によるもの。

1‐3.平均値のワナと中央値、最頻値
分布が平均を中心として釣鐘状に分布している場合は、平均値が最もデータの集中している数字であり、データの代表選手としての納得感も高くなります。しかし、金融資産分布に代表されるように、データの分布に偏りがある場合、必ずしも平均値の周りにはデータが集中しておらず、平均値が納得感の高い代表値とは限らない。

このような場合、平均値とは別に、全体を代表する値の取り方として、中央値（メジアン）、最頻値（モード）がある。

中央値
標本の数値を順に並べたときにサンプルサイズの半分の順位に相当する値を指す（サンプルサイズが偶数の場合は、半分を挟んだ 2つの標本の数値の平均を取る）。

最頻値
最も度数が高い数値を指す。ヒストグラムを描いたときに「山」が2つ以上できる場合や、単純平均を出そうとするとき一部の「外れ値（例外的な値）」が影響を与えてしまう場合などに採用される。家計の金融資産の例では「保有なし」世帯が最も多く、「保有なし」が最頻値となる。

8.回帰分析とモデル化

数式にまとめる方法には、大別するとデータから帰納的に式を求める「回帰分析」と、データからではなく、演繹的に式を求める「モデル化」の2つの方法がある。

回帰分析は世界中で最もよく使われている統計分析の手法。

回帰分析は「比較」ではあるのですが、同時に、第 3章で説明した、ビッグデータの世界でより重要となりつつある機械学習の入口にある分析手法。

回帰分析に至る散布図、相関といった考え方は因果関係を探り、Why?という問いに対する答えを考えるうえできわめて重要。

一方モデル化は、たとえば「売上＝客数×客単価」といったような形に、関心のある結果（アウトプット）を式の形で要素（インプット）に分解する方法。

式の形に分解することで、結果を出すためにどのような要素にどのようなアクションをとればよいのか捉えやすくなる。

9.散布図と相関係数

相関とは？
相関とは、2つの変数の間に何らかの法則性、
共変性がある状態を言う。

たとえば、気温が高くなればビールの売上も上がる、気温が低ければビールの売上も下がるという連動性がある場合、「気温」と「ビールの売上」には相関があるといえる。

相関には、「正／負」と「強さ」があり、それを数値で表したものを相関係数という。散布図上で、データに対して直線で傾向線を引いた時にその直線の周りにどれだけデータが「直線らしく」集まっているかの度合い、と考えてもよいかもしれない。

この相関係数を2乗した値が単回帰で説明する決定係数になる。

相関係数は、そのままでは強弱の解釈が直感的に難しいのですが、2乗して決定係数に変換することで、 yの分散のうちの何パーセントが xによって
説明できるか、すなわち、 yに対する xの説明力として解釈が可能。

相関係数を見たら2乗するクセをつけておこう
先ほど、強い相関の目安とした相関係数の0. 7は2乗すると0. 49となります。すなわち、ほぼ 50％の説明力に相当することが
わかる。

★相関係数の数値の解釈例（絶対値）
0～0.2：ほとんど相関関係がない
0.2～0.4：やや相関関係がある
0.4～0.7：かなり相関関係がある
0.7～1.0：強い相関関係がある

ただし、この相関係数の大小の解釈については分野によっても異なってくる。

心理学などの分野での解釈例
★相関係数の数値の解釈例（絶対値）
0.5：効果大
1.3：効果中
1.1：効果小

相関関係 ≠因果関係
相関があるからといって、因果関係があるとはいえない。それでは、どんなことがいえれば因果関係があると見なせるのか。よく使われる必要条件は、次の3つ。

①原因は結果に時間的に先行する
②相関（共変）している
③相関関係は他の変数（第三因子）で説明されない

前述のとおり、因果関係がある場合は相関関係もありますが、相関関係があるからといって必ずしも因果関係があるとは限らない。 3点目の第三因子は見過ごされやすく、注意が必要。

最後に

自分自身は数字に対して「好き」や「得意」を感じたことは今までありませんでした。

ですが、この本を読むと数字を使って分析することの楽しさが少し分かるような気がします。

本のエッセンスが詰まった下記図をたまに見返して、仕事に活かしていきたいと思います。

以上です。

この記事が気に入ったらサポートをしてみませんか？