見出し画像

固い仮説とシンプルな解析

世の中にはたくさんの分析モデルがあり、日々勉強なわけですが、実務でデータを扱う仕事をしていると、なるべくシンプルな解析で済ませられるのがいいなと思います。

わかりやすい理由は以下です。
まず、シンプルな解析のほうが解釈が簡単です。
何を比べたり、軸に置いたりしているかがわかりやすく、結果の意味するところがはっきりしています。
特に、統計や数学の専門性を持っていない人に説明することが求められる実務では、これは重要なポイントです。

また、シンプルな解析のほうが扱える場面が多いように思います。
実務ではデータ数が少なかったり、きれいに構造化されたデータが得られにくかったりするので、高度なモデルが求める制約条件を満たせないことも多くあります。

これに加えて最近気づいたのが、シンプルな集計や解析で議論できるかどうかで、仮説の練度や背景知識の揃い具合を測れるというものです。

シンプルな集計や解析(ヒストグラムや散布図、相関分析などを想定)では、結果が比較的明瞭なぶん、それをもとに議論するためには解釈者側に十分な材料が必要になります。
解釈する人が理論に裏打ちされた仮説をしっかり組み立てていたり、豊かなドメイン知識を持っていたりすると、単純な集計だけでもかなり議論が膨らみます。
その議論を受けて、必要に応じてより高度な分析の方針を立てることができるようになります。

今日やっていた研究の議論では、ヒストグラムと相関係数だけでも2時間くらい議論ができました。
それは調査を始めるまでに異様なほど時間をかけて、チームで理論と仮説を練りまくったからだと思います。

高度な分析はいろいろ見えることがありますし、何より楽しいのでいち早くそちらに取り組みたくなりますが、まずはシンプルで泥臭い集計に向き合うことが大切だと思います。

もし、シンプルな集計で議論が進まなければ、それは「仮説や前提知識が足りないんじゃない?」というデータのささやきなのかもしれません。

写真は旧縁で連れて行ってもらったワイン屋さんでの試飲の様子です。
仮説検証と比較分析です。

この記事が気に入ったらサポートをしてみませんか?