データの影にひそむ、むなしさ
出来上がったグラフを見て、あれっと首をかしげた。
なんか、おかしい。明らかにおかしい。
確認してみたところ、公開されている大元のデータがなんか変だ。
なんでこんなことになっているんだろう、と調べてみてもよくわからない。
見ているデータは、いろんな国の経済状況にまつわる公的なデータ(GDPとか、ね)。その中で、季節調整っていう処理がなされたものを見ている。
その季節調整ってものの仕方の問題だろうと思うんだけれど、よくわからない。
ひとりで考えてみても埒が明かない。
指導教官ではない、年の近い先生にzoomを飛ばしてみることにした。
*
「ああ、確かに変だね。他のデータソースも確認した?」
同じデータを提供している他のサイトも確認済み。どこも同じことが起きていた。
「あー、そう。」
そうなんですよ、だから困ってるんです。これ、どうしましょう。元データおかしいともう何やったってだめそうじゃないですか。
「で、何やろうと思ってたの」
かくかくしかじか、で、一応結果は出ているんですけど、でもこの元のデータが心配で。
「え、なんでそれが問題なの?データのこの変な部分は、きみのやってる作業に影響しないんじゃないの」
*
はっ、と我にかえった。
確かに、データは変っちゃ変だけれど、でも少なくともいまやっていることへの影響はおそらく、ほとんどない。
「自分のやってる分析に、何が影響して何が影響しないか、考えて。影響しない細かい部分まで気にしていたらだめだよ」
そうだった。”影響しない、もしくは影響の度合いが低い、あるいは影響する確率の低いものを気にする”ことは、必ずしもよい研究につながるとは、限らない。
自分が見たいもの・見ているものをしっかりと考えて、まず潰すべきは、この結果に大きく影響しうるものたちだ。
今回のケースでは、先生の言う通り、データのおかしな点が私の分析の結果に左右されることは、考えにくい。だから、必ずしも、気にする必要はない。
*
そう、わかりながらも。先生の言っていることは、”研究者”という職業を生きる上でも真っ当で、大事なことだとわかっていながらも。
でも、心の中で、「いや、でも影響しうる何かがあるんじゃないか」なんて思ってしまう。
途中で、データの計算方法を変えたとかで、変なことが起きているとか。
実際に、GDPとかの国の経済情勢を表すデータは、計算方法や基準の改定が行われたりする。
長期のデータを作る際は、データを作る人たちが、過去のデータと今のデータの”継ぎ足し”をしている。その際は、過去のデータの基準といまのデータの基準が整合的になるように作られているはずだけれど、その”継ぎ足し”のせいで何かが起きているかもしれない。
でも、「統計が正しく作られているか」(不正という意味だけじゃなく、見たいものをなるべく正確に表すようにできているか)は、また別の話。別の研究となりうる大きな話で、いま私が分析していることとは遠い話。
”かもしれない”なことを確かめるためのコストは、計り知れないくらい大きい。
”いま見たいこと”のために、ある程度、データの成り立ちを知っておくことはとっても大事。
でも、”いま見たいこと”のために、細かく細かくチェックして、「正しく作られているか」まで考えることは、ちょっと、遠回りがすぎる。「正しく作るにはどうしたらいいか」まで考えちゃうのは、途方もない。
そのテーマで研究するのだったらいいのだけど、そうじゃないから、ある程度目をつぶるしかないときも、ある。
*
こうやって、自分の手で作ることができない、自分の手で条件をコントロールし切ることができないデータを扱うのは、なんというか、ときに、むなしくなる。
何度、はっと我に返って、
「いかんいかん、今回のこれはこの取り組みには影響しないだろうから、気にしてちゃダメだ」
「もし影響したとしてもどうすることもできないし、他の研究だってこうしているし、それでトップジャーナルにも載っているから、このまま進めよう」
と思い直しても、やっぱり、もやもやはしている。
正しくないかもしれないデータからわかったことを、説明する理論を一生懸命時間をかけて作って。それが、政策に反映されて、人々の生活に影響を与えたりもしうる。
大元のデータが間違っていて、そうして”わかったこと”がその間違いによって生み出されていたことだったとしたら、もう、なにがなんだかわからなくなってしまう。
そんなことはないと信じたい。信じたいけれど、統計の作り方がおかしかった事件は、実際にこの国であった。
与えられた、利用できるデータを信じるしかない。このデータを作っている人や組織を信じるしかない。
もし仮に、このデータというものが不適切だったとしても。きっと何かしらの”予想”(prior)の形成に、かけらくらいは役立っているかもしれない、と、小さな希望を持ったりしている。ときに、半ばむりやりに。
*
むなしい。私は一体何をやっているんだ、と、無性にかなしくなる。
それでも、いまできることをやるしかない。
ほかの、自分の手である程度データを作れる・コントロールできる分野に行きたくなるときもある。頭が追いつかないだろうけれど、データを扱わず広く普遍的な事柄を明らかにする純粋な理論家に憧れることもある。
でも、どんなところに行ったって、その先で葛藤がないことなど、たぶんない。
自分のやりたいことを考えたときに、他のところがいまいるところよりもいいとは、思えない。
どこで何をしていたって、できることをするしかない。
できる限り、良いと思うことをしていくしかない。
もしも、「データに潜在的にありえる問題」が本当にシリアスなものとして思えてきて、それに挑みたいと思ったら、思う存分に取り組めばいい。でも、まだその時期じゃ、ない。
手の届かない範囲のことを気にかけるより、手の届く範囲のことをしっかりと丁寧にやるしかない。
たとえ、むなしさを抱えていたとしても、”最善”に近づけるために他にできることはいっぱいある。
*
ーーそれでもやっぱり、折り合いをうまくつけられなくて、むなしさはなかなか消えず、もやもやしている。
でも、やっぱりできることをするしかない、と思うから、長々と心の整理がてらに記事に書いてしまった。
研究者として生きることって、こういうむなしさと戦うことなのかなあ。私がまだ至らないだけなのだろうか。むずかしい。
もしも、サポートしたいと思っていただけたなら。「サポートする」のボタンを押す指を引っ込めて、一番大切な人や、身の回りでしんどそうにしている人の顔を思い浮かべてください。 そして、私へのサポートのお金の分、その人たちに些細なプレゼントをしてあげてください。