見出し画像

分析とは何か?――単なる記述との違い

「データ分析とは何か?」という問いに直接的に答えようとすると、実は意外に難しいことに気付きます。また、しばしば「事実の『記述』と『分析』は異なる」などと言われることがありますが、その違いはどこにあるのでしょうか。

分析という言葉を構成している「分」も「析」も、ともに「分ける」という意味です。では、何と何を分けるのか。要素を細かく分解するという解釈もありますが、ここでは語源を無視して、独自の解釈をしてみたいと思います。それは「ルール」と「ノイズ」を分けるのが分析であるというものです。

データ分析手法の1つである統計学は、ばらつきのある観測データから規則性を見つけ出す方法を体系化したものです。観測データないし観測された事象というのは常に誤差(ノイズ)を含んだものであるため、このノイズを除去して「真の構造」を抽出します。裏を返すと、事象ないしデータというのはそれ自体ではノイズを含んだものであり、そのままの状態においては、必ずしも価値があるわけではないということです。

画像1

では「真の構造」とは何か。

少し脱線しますが、フランスで発祥し、日本では80年代に流行した「構造主義」という思想があります。非常に乱暴な紹介にはなりますが、婚姻の体系を数学の群論で説明するなど、社会における事象(パターン)を成り立たせている構造(ルール)を研究するものです。ここでいう「構造」とはある状態を実現する「ルール」のことです。

先の定義で述べた「真の構造」も同じように理解できると思います。つまり、事象の根底にあるルールこそが統計学、ひいてはデータ分析が取り出そうとしているものです。

現実に起こっている事象をありのままに受け止め記述するのではなく(それは単なる事実の描写に過ぎないからです)、その事象の根底にあって、その事象に必然性を与えている根源的なルールを取り出すために、ノイズを除去していく作業が分析なのです。

本記事は、2016年7月22日に掲載したInsight for Dの記事を、note用に許可を得て転載しています。
※元記事:https://d-marketing.yahoo.co.jp/entry/20160722410786.html
(Insight for Dは2020年6月30日に終了予定です)



この記事が気に入ったらサポートをしてみませんか?