データ分析の科学としてのデータサイエンスの始まり

John Tukey は 1962 年に "The Future of Data Analysis" という論文を発表し、当時の統計学のアプローチを大きく批判しました。主な主張は以下の通りです。

  • 自分は長らく統計学者だと思ってきたが、数理統計学の発展を見るにつれ、疑問を感じるようになった。

  • 自分の中心的な関心事は、データ分析であり、それは数理統計学が適用されるデータを分析する手順、その手順の結果を解釈する技術、データ収集の計画などを含む、より広範なものである。

  • データ分析は知的内容、理解可能な形式、経験による検証の3つの要素をすべて持つ科学である。一方、論理的な一貫性と証明可能性を重視する数学は、経験による検証がないため、科学ではない。

  • データ分析は数学ではなく科学の特性を持つべきであり、実務に沿って発展すべきである。

  • データ分析の教育は数学の定理証明を中心とするのではなく、事実関係の知識の伝達に力を入れるべきである。

つまり、Tukeyは統計学を数学の一分野としてではなく、データから学ぶ科学として再定義し、理論よりも実データ分析を重視する必要性を説いたのです。これが、データ分析の科学としてのデータサイエンスの始まりと言えます。

この記事が気に入ったらサポートをしてみませんか?