見出し画像

統計の日

 1879年10月18日に、生産統計の起源となった府県物産表に関する太政官布告が公布されたことにちなんで、閣議決定された記念日ということだが、世界統計デーは10月20日に控えているから、
今日は頭出しにするとして、そのときにでも書こうと思うが、それでも、どこまで体系的にできるかはわからない。
いちおう、統計学については、一通り学んだつもりではあるものの、一番の肝はやはり、数値をどう捉えるかである。数値を集めて、”数値の意味合い的な数値”を算出することはできても、それをどこまで使っていくかはまだ実のところ、私はよくわかっていない。その前に、まず一番大事なのは、どういう問いを立てるかであろう。

La plus importante question, dans le débat public, c’est sans doute de savoir quelle est la question la plus importante ! Quel est le vrai problème ? Celui qui s’impose à tous ? Qui en décidera ? Il y a toujours eu une concurrence des problèmes et une controverse sur la priorité des problèmes. Mais l’écart n’a jamais été aussi grand entre les prétendants pour les définir : les chercheurs, les politiques, et les citoyens bien sûr, de plus d’une façon. Sans oublier les faux problèmes qui surgissent, envahissent tout, disparaissent ou parfois persistent en éclipsant le reste. Même la pandémie n’a pas imposé un ensemble simple de « vrais problèmes » évidents ! Comment faire alors ? Nous en parlons ce soir avec deux médiateurs qui ont l’expérience de plus d’une discussion des problèmes : Dominique Méda, professeure de sociologie, qui a l’expérience des ministères et du débat public ; Loup Wolff, administrateur de l’Insee, enseignant également, et qui travaille aussi sur la « démocratie des chiffres ». La clé n’est-elle pas dans le recoupement des prétendants et des discours, les statistiques et la science, les attentes citoyennes, le débat démocratique ? En tout cas « le vrai problème » c’est déjà de parler des vrais problèmes, aujourd’hui, à présent.

私の仕事は、プロジェクトを良くすることである。ところが、どうなったら良いといえるのか。そのためにどのような数字を集め、どう解釈するのか。
例を挙げてみよう。進捗が遅れてはいけない。よくあるプロジェクトの課題である。まずは、進捗が遅れないプロジェクトを良いプロジェクトだと設定し、私達チームは、この問題に取り組んだ。そして、いったい、プロジェクトの進捗はどのように”測られている”のか・・・を知ることから始める。プロジェクトのサブリーダーがプログラマーに近寄る。
進捗はどう?予定どおり? 
プログラマーは答える、だいたい順調です! 。。。OK。
あるいは、プログラマーは答える。
すみません、少し遅れています! 。。。!!
サブリーダーは、どのくらい遅れている? 遅れている原因は何?
どうして報告しなかった?
答えに窮したプログラマーはたいてい次のように答える。
あぁ、でも、今日中には終わると思います。なので約1人日遅れています。

各サブリーダーは、進捗会議なるものに赴き、つぎのように発表する。
--Bさんだけ遅れています。そうですね。だいたい明日には追いつくと思います。

とても、数値化ができていない。まずは、この数値化に取り組むこととし、プログラマーの作業を観察した。プログラマーはコーディング(プログラムコードを書く作業)が終わると構成管理ツール(いまはたいていGitだ)にコミットする。そこで、構成管理ツールに記録されたコーディングの行数を取得することにした。
最初にだいたいの工数を見積もっている。この機能なら2人日でコーディングが終わるだろうみたいな数値だ。とりあえずこれがあり、コーディングが一日何行書けていれば妥当なのかも予想できる。(さらに数値化を続けていけばより予想の妥当性が上がる)
コミットされた行数を測れば進捗はだいたいのところがわかる。昨日100行書いたのに今日は50行だったら、いちいちプログラマーのもとに行かなくても遅延の兆候が伺える。もちろん、プログラムにはいろいろな様相が違うため、一概にこの数値だけで遅延と決めつけるわけにはいかないが、大事なのは変化を客観的に数値としてとらえることである。

実プロジェクトを使ってモニタリングすると、口頭での進捗が無意味であることがわかってきたのだ。数値をもとに、サブリーダーは昨日より生産性が落ちていることを指摘することが可能になっただけでも、進捗会議でプログラマーの嘘っぱちをそのまま忖度しなくてもいいわけである。
最初はこの目論見はうまく機能したが、ある日から突然、数値が取得できなくなった。プログラマーがコミットをしなくなったからである。理由はもっともらしかった。単体テストが終わってからコミットします!という言説をきかされた。ほかにももっともらしい、いろんな理由が述べられたが、私に云わせれば、監視されるのが嫌だというのが主な理由だ。
 これと同じことは国レベルでも発生している。昨年の6月に金融審議会が老後を30年とするなら2000万の貯蓄が必要だと発表した。いわゆる”老後2000万問題”だ。せっかくの報告書なのに、麻生大臣は、正式な報告とは受け取らないと言明した。
なんでだ? 金融審議会がミスったのか?報告書の内容は、高齢者の無職世帯の収入・支出をシミュレートしたものだった。
社会保障給付と実際の支出を比べ、毎月約5.5万円の赤字となる。赤字の5万円は働かない限り埋まることはなく、1年で60万、30年で1800万の赤字、ゆえに2000万の貯蓄が必要だという妥当なもので、年金額は減額傾向にあるため、この数値はしかも少なく見積もってもということになる。さらに可処分所得は減っているので、貯蓄額2000万を保有する世帯は少ないと見積もっていいだろう。これを見て、早めに対策を打つことが必要だ。少しでも収入が多い職種を選んだり、生活を見直し少しでも貯蓄に回したり、老後無職にならないように準備したり、、、、それでも、正式に受け取らないだけで、なぜかこの対策について云々はされなくなってしまった。
老後というのが働かなくても生活していける期間だということなら、その期間は限りなくゼロになっていく傾向にあるのだ。少子化だからだ。だったら、たとえば海外移住など、いくらでも対策はあると思うのだが、それもあまり話題にあがらない。統計的数値でみれば、日本はもはや老人を養えるような人口構造をしていないことは明らかなのに、である。
統計の日なので、数値化しながら書こう。
財政検証という作業は、将来の公的年金の財政見通しを算出することである。その前提は以下に示す。

スクリーンショット 2020-10-17 19.42.09

このケースⅥは、一番やばいケースということなのである。すなわち物価上昇率は0.5%でかつ賃金上昇率0.4%なのだが この数字でさえも、過去28年で1度しか実現していないのである。そして、これが最低なのであるからして、毎年この数値を達成していかなくてはならない。ケースⅠ〜Ⅴはみなくてもいいくらいひどい報告だ。コロナショックで目も当てられない状況の中、社会保障の立て直しはまずもって不可能であろうと予想するほうが妥当である。
以下 厚生労働省が発表している名目と実質賃金の表である。

スクリーンショット 2020-10-17 19.53.46

これで、0.4%上昇が見込まれると思う方はどのくらいいらっしゃるだろうか・・

ここで、過去ブログを参照しよう
2017年の今日(10月18日)に書いたものである。

昨年読んだ本の中に
統計学が最強の学問であると唱える本があった。

最強の意味がよくわからないが
確かに応用範囲が広く偏在的で
実学として有用性もあるだろう。

統計学は良くも悪くも
即戦力のあるだろうソリューションを提供する
例えば
ワインの専門家がいる
いろんなワインを飲み、
これはタンニンが少ないとか
少し嫌味な風味があるといった具合に
ワインに対する評価を決める
決めては専門家の勘と経験に依拠する
専門家を作るには
ワイン行脚が必要でコストがかかる

然し乍ら、ワインの良し悪しは葡萄の出来によるところが大きい。
それでは、葡萄の良し悪しはというと
実は降水量によるとのこと、
であればワインの専門家にかけるコストは要らず
降水量の統計だけとればいい。

同様のことが日本茶にもいえる
茶の良し悪しは茶の葉に含まれる
窒素の量によるとのこと
であれば、お歴々の開く品評会は不要である
窒素の含有量は衛星からわかる

統計の利点として
悪くも良くも結果しかない。

理由はどうあれ、そうなったのだ
理由はどうあれ、同じ法則であれば
結果は統計学のデータに帰着するのである

理由の追求は後付である
それは全然別の理由かもしれず、
評価はすでに出ているのである

努力の末、仮説を立て
実証して科学的に裏付けるまで
結構な努力が必要なのであるが
統計学はそれをショートカットできる

さまざまに埋め込まれた
センサーデバイスにより、
今や さまざまなデータが集積でき
かつ
ビッグデータ解析によって
いろんな事象について分析結果を得ることができる。
株がどういう値動きをするのか
将棋はどうさせば勝てるのか
どういう時に事故が起きやすいのか
人工知能にディープラーニングさせれば
自ずと解析できるのだ。

勘と経験は排除し、
仕掛けを作れば努力は要らず
そのデータを使えば、正しさが得られる
真実は統計学によって数値化できるのだ。
しかし、真理はいまだに藪の中なのである。
故に、悩みから人が解放されるまではいかないであろう
と思う。

最強とは、今なら意味がわかる。
これは統計学の用語で、mostpowerfulという。
間違った仮設を採用してしまう確率を最低限に保った上で、正しい仮説を見落とす確率が最小のもの
という意味である。
言うは易く行うは難し、だが、正しい努力の方向を見つけたらそちらの方向に努力せよ。ということなのである。
勘と経験にコンコルド効果でしがみつくのは容易い。見ても楽しくもない数値に目をつぶるのも容易い。しかし、必要なのは、統計が正しいことが確認できたのなら、それをもとに、活動を改める勇気を持つことである。
その勇気なくば、せっかく算出した統計も意味はない。

過去ブログでは努力が無用としているが、それは訂正すべきである。
無駄な努力や根性論は不要だということである。あとはお歴々のしかめっ面も無用だ。
スポーツの世界は統計でだいぶ様変わりして、記録も伸びている。
どういったトレーニングが正しい、最強な努力かを追求しているからだ。
それなら、最強な生活がどのようなものか、あるいは老後の期間がほしいならどうすればよいのかをもっと話題にあげてよいのではないだろうか・・・

プロジェクトも、コミットをしないと測れない。年金の問題も耳を塞いでいても打ち出の小槌はない。

------------------------------------------------
<来年の宿題>
・統計について
・最高のライフポートフィリオ☆
-----------------------------------------------


この記事が気に入ったらサポートをしてみませんか?