現実世界をデータで捉えるということ

「データは21世紀の石油」などと言われ,データが富を生み出す原資のように語られて久しい.また,昨今では「データの民主化」とも言われ,専門職のみならず自分に必要なデータを見ながら意思決定をするようになりつつある.最近では,マーケターよりもより現場に近い担当者の方がエビデンスを元に意思決定すべきであるとして,データに対する要望は増える一方だ.より良い意思決定をするためにデータを活用しようとする文化が広まっていることは歓迎すべきことだと思う.しかし,データの専門職である立場から眺めてみるとデータの活用,特に「意思決定をするためのデータ」を正しく理解し取り扱うには訓練が必要だと実感している.

売り上げや販売数など,実績として上がって来るデータは現実世界を比較的,忠実に反映している.「比較的」と言っているのは,こういった成績に繋がるような実績データに関しては計測されると同時に力が働き始めるからだ.それも含めて現実世界を捉えていると言ってしまえば,それまでだが,予算に到達させるために架空発注するなどなれば,もはや現実世界を表しているとは言えないだろう.こういった事が発生し得る事は認識しておくべきだがここでは置いておくと,これらのデータは売上管理などに使用されることを目的として取得されたもので解釈の余地が少ない.誰が見ても解釈に違いが生じにくいということだ.

それに対して,「意思決定をするためのデータ」は解釈の余地が大きくなって来る.売上を上げる為に「購入単価(一回あたり)」を上げるという目標を立てれば,売上(月間)/購入数(月間)を上げるということだ.だが,一回割り算をしただけで考える事は山ほど増える.商材が何かにもよるが,飲食店であればサイドメニューを追加して貰えるようなものにするか,ロースのステーキでなく,サーロインのステーキを推してみるか.でも,待てよ.ここはサラリーマンがたまにちょっと贅沢できるランチ店だ.サーロインは客寄せで利幅を少なく設定している.そうなると,売上増えても利益は伸びない.であれば,利益率も考慮したい...となってくれば,途端に考えなければならない事が爆発的に増えて来る.こんなシンプルな割り算一つでその数字が意味する事が難しくなるわけで,現実世界はより複雑だ.

データサイエンスの世界では「統計数理」,「プログラミングスキル」,「ドメイン知識」の3つが重要と言われている.「統計数理」と「プログラミングスキル」については,優れた書籍や講義があり,確立された一定の方法が存在する.一方,「ドメイン知識」というのが何とも分かりにくい.データを活用する業界の知識やノウハウを指しており,その世界の秘伝のタレのようなものの理解が重要だという話だ.その世界の達人にしか分からない秘伝のタレを何とかデータで捉えて,活かしたいと思うわけだが,まず人間が知覚している現象の言語化が難しい.加えて,データとして計測できるものとなると現実世界のある一部分を捉えているに過ぎない.これらを理解していないと「統計数理」,「プログラミングスキル」が如何に優れていようと意味をなさない.

過去に,NHKスペシャルで「AIに聞いてみた どうすんのよ!?ニッポン」なるものが,炎上した事がある.ビッグデータを解析した結果,「健康になりたければ病院を減らせ」という事が分かったというのだ.これはデータ間の関係性である相関を計算する事で二者の間に片方が減ればもう片方も減るという関係性が分かったと言っている.夕張市が財政破綻し,病院が減った結果としてガンや心臓病で亡くなる人が減ったというのだ.これを聞いて,「なるほど,では東京も病院を減らして健康になろう!」となったら皆さんは何と言うべきか.おそらく考えるべき事はこうだ.夕張市は大きな病院が無くなり,ガンや心臓病のような高度な医療を受ける事が出来なくなった.ガンや心臓病の患者は夕張市を出て,医療を受けられる街に引っ越していく.その結果として,健康な人だけが残っているに過ぎない.

これは「擬似相関」と呼ばれるもので「病院数」と「ガン・心臓病死亡率」に直接の関係は無いにも関わらず,巡り巡ってそう見えるにすぎない.「日本の殺人犯の9割以上が前日にお米を食べていた」というネタもあるが,理屈は同じだ.ここまで来るとトンチのようだが,実際のビジネスの世界ではいわゆるドメイン知識が無いとうっかりのこの迷宮に迷い込む事は少なくない.加えてデータが何を反映しているもので,その背景に何が潜んでいるのかを思考する事も重要だ.つまり,ドメイン知識とデータリテラシーのようなものをもって間を埋める必要がある.ドメイン知識を持っている人間は現場にいる.しかし,間を埋めるデータリテラシーのようなものがいまいち理解し難く,出来る人だけが出来るようなものになっている.

このように,現実世界の何をその「データ」が捉えており,その「データ」から推論する事で現実世界のどこまでを捉えられ,意思決定の何に活かす事ができるのかという重要性が語られる事はあってもどうすべきか,またどう考えるべきかが語られる事は少ない.これは答えが無いというのが正解かもしれないが,私は哲学や推論,抽象化思考が極めて有用だと考えている.

だいぶ長くなったので次回以降で,現実世界をデータでどう捉えるかを考えていきたい.

この記事が気に入ったらサポートをしてみませんか?