見出し画像

[Vol.7] データサイエンティストとしての心得

立正大学データサイエンス学部データサイエンス学科 教授 家富洋

■ データと法則
 皆さんが高校数学の中で学ぶ確率・統計の重要性がますます認識されています。SNS上での交流・情報発信,GPS位置情報に基づく人流、クレジットカードやネット通販の利用歴,銀行の振込履歴など膨大な経済・社会データが日々記録されています。各企業は、自身で収集した大量の取引情報などをビッグデータと呼び、新しい経営戦略の策定やサービスの提供などに活用し始めています。その重要なポイントは、単に統計学の手法を使ってのビッグデータの情報処理(平均、分散、相関係数などの計算)ばかりではなく、ビッグデータの背後に潜む普遍的な法則を見つけ出すことです。基本の法則を知ることができれば、どんなに複雑な現象に出会っても怖れることはありません。そのような探求の営みを強調するため、データサイエンスという造語も生まれました。また、データサイエンスを生業とする人は、データサイエンティストと呼ばれます。

■ ヨハネス・ケプラー
 データサイエンティストのパイオニアは、何と言ってもヨハネス・ケプラー(1571-1630)です。ケプラーは、ドイツの居酒屋の息子として生まれ、天文学に興味をもち、最初は宇宙を思索していました。コペルニクスの地動説を支持し、ガリレオとも交流がありました。その後、ティコ・ブラーエに弟子入りし、火星の運行記録をはじめとしてブラーエが長年の天体観測によって得た貴重なデータを譲り受けました。そしてもらった膨大な観測データの解析から、ケプラーの名が冠された天体運動に関する3法則を経験的に導き出しました。

第1法則「惑星は太陽を焦点の1つとする楕円軌道を描いて運動する。」
第2法則「惑星と太陽とを結ぶ動径が単位時間に掃く面積は一定である。」
第3法則「惑星の公転周期の2乗は,楕円軌道の半長径の3乗に比例する。」

 ケプラーは、何度も何度も手間のかかる筆算を繰り返し、幾多の法則を試したに違いありません。私は、10年ほど前に、オーストリアのリンツにあるケプラーが家族とともに住んでいた家を訪問し、データと格闘するケプラーに思いを馳せました。図1はその折の一コマです。ケプラーは、1621年から1626年の間にこの家に住み、主要な天文学の仕事であるルドルフ表(ルドルフ2世の勅命で作成された天文表)を完成させました。

画像1

図1 リンツにおけるケプラーの住居前で

■ ケプラーの自然観
 では何故、ケプラーは天体運行の基本法則を発見することができたのでしょうか。アイザック・ニュートンによる力学法則と万有引力の法則を知ってしまえば、ケプラーの法則は、演繹的に導かれます。しかし、ケプラーは、逆問題としてデータを綿密に調べることでそれらの法則に到達しました。そのようなケプラーの弛まぬ努力と根気は、まことに驚異です。実は、データサイエンティストになる前のケプラーは、ギリシャ哲学に端を発するプラトン的な数学的調和に基づく自然観を持っていました。図2に示す正多面体と惑星の半径との関係に関する理解がその典型例です(5種類の正多面体しか数学的に存在せず、また、当時太陽系で知られていた惑星は、水星、金星、火星、木星、土星の5つだけでした)。

画像2

図2 ケプラーによる『宇宙の神秘』(1596年刊)の中で示された正多面体と惑星の半径との関係

まず、正八面体の内接球の半径を水星の軌道半径に対応させ、その外接球の半径を金星の軌道半径に対応させます。次に、正八面体の外接球と正二十面体の内接球を一致させ、そのように決められた正二十面体の外接球の半径を地球の軌道半径に対応させます。図2のように、5種類の正多面体の入れ子構造を順次つくると、一番外側の立方体の外接円の半径が土星の軌道半径に対応します。今から見ると、ずいぶん滑稽な考え方のようですが、この信念がケプラーにとって膨大なデータの中から基本法則を見つけるための原動力となりました。

■ 信念と思考の柔軟性
 ここで紹介したケプラーの事例から、データサイエンティストとしての心得を学んでみましょう。まず、データサイエンティストにとって必要なものは、「信念」です。ちょっと大げさかもしれません。いずれにしても、自らの考え方(作業仮説と言ってもよいでしょう)を持つことがとても大切です。信念を持たず膨大なデータを眺めていても、ただただその前でたたずむばかりです。信念を持つことにより、茫洋としたデータの大海を泳ぎ始める勇気も湧き出ます。しかし、ケプラーは、自分の信念に固執していたわけではありません。ケプラーは、データサイエンティストにとってもう一つ重要なことがあることを教えてくれます。それは「思考の柔軟性」です。ケプラーを含めて当時の人々は、惑星の軌道は真円であると固く信じていました。ところが、ケプラーは、データ解析の結果からその常識を捨て去り、惑星が描く軌道は楕円であることを受け入れました。まさに、実験や観察に基づく経験的実証性を尊ぶサイエンスの精神です。信念と思考の柔軟性とを併せ持てば、データサイエンティストとして鬼に金棒です。