見出し画像

不審者に肥満が少ない理由を考える データアナリストへの道#20

デジテック for YAMAGUCHI 運営事務局 兼 Y-BASEスタッフのハラマルです。

今シーズンのレノファ山口は、幸先よく白星発進しました。今週末の日曜日にも、ホームで試合が予定されており、あの、遠藤選手を擁するジュビロ磐田との対戦です。地上波テレビ中継もありますので、試合を目にする方も多いかもしれませんね。
また、4月には日本代表GKの権田修一選手も、「みらスタ」にやってきます。嘘のような本当の話ですので、興味がある方は、チケットがいつから販売されるか要チェックですよ!

今回のテーマ

さて、前回、山口県の不審者(2022年)に肥満の人が少ないという、予想だにしていなかったデータ分析結果が出て、これってどういうこと?というのが、ずっと気になっていました。

不審者の年齢と体格(2022年、性別:男性、山口県)

データアナリストを目指すとか言いつつ、今までデータ可視化だけをして、それっきりになっていましたので、今回は、このことについて、もう少し正面から捉えてみたいと思います。

仮説① 偶然?

まず最初に考えられる仮説は、「偶然」です。
不審者として通報された人物のうち、たまたま、2022年は肥満な人が少なかったという仮説です。

最初に思い付くだけあって、もっともらしい気がしますが、何せ、比較するデータがありませんので、真偽が分かりません
今回、全都道府県のオープンデータカタログサイトや、各警察のオープンデータを探してみましたが、山口県のように、不審者の体型までオープンにしているデータは見当たりませんでした
山口県でも、2022年から公開が始まりましたので、過去のデータは不明です。
このため、他県や、山口県の2023年以降といった、データがもっと集まってくると、これが偶然なのか、引き続き同じような傾向が見られるのかが分かってくるのではないかと期待されます。

ところで、ここで一つ疑問が。この仮説が正しかった場合、これってどれくらいの偶然なのでしょうか?

厚生労働省が健康増進法に基づき、毎年実施しているという「国民健康・栄養調査」によると、「肥満者」とはBMI(体格指数Body Mass Index=体重/身長の2乗)が25 kg/m2以上の人と定義されており、その割合は、男性で33.0%となっています。年代別にみると、20代が最も低く23.1%、最も高い40代では39.7%となっています。
※令和4年は集計中、令和2年・3年は新型コロナウイルス感染症の影響により調査中止、ということで、令和元年度の調査結果が最新の情報です。

一方、2022年の不審者の男性では、体格が不明な場合を除く341件のうち、肥満が1.5%、小肥が14.4%、やせ型と中肉が84.2%となっています。
これをグラフで表すと以下のようになります。

年代別の男性肥満割合(青丸)と、不審者のうち肥満の割合(上段赤棒)、肥満+小肥の割合(下段オレンジ棒)

国の調査による男性の肥満率(青丸)に比べて、不審者のうち肥満の割合(上段の赤棒)はかなり少ないです。
下段は、肥満に小肥も足した場合の割合をオレンジ棒で表してみたものですが、これでも、サンプル数が少ない10歳代・70歳代以上を除くと、全ての世代で、平均的な肥満割合の半分程度しか、不審者に肥満がいないことになっています。

これを偶然と片付けて良いものでしょうか…。難しいところですね。

仮説② 移動手段が徒歩だから?

ということはですよ、仮に、2022年のデータが偶然でないとすると、何らかの理由があって、不審者に肥満が少なかったことになります。
そんな理由があるでしょうか?自分で言っておきながら、袋小路に自ら迷い込んでいっているような気もしますね。

パッとは思いつかないので、何日かかけて、いろいろと想像を巡らせてみましたが、一つのデータから突破口を見つけてみました。

それは、前回のデータ分析で明らかになった、不審者の特徴として、「移動手段が徒歩」というのが圧倒的に多かったというデータです。
不審者が男性の場合、移動手段のうち64.2%が徒歩、その次の車は18.7%でした(不明を除く)。

不審者の性別と移動手段

移動手段の最も多いのが徒歩である理由というのも、具体的には明らかになっているわけではありませんが、例えば、自家用車の場合だとナンバーを目撃されるおそれがある、という心理的な理由があるのではないかと推察されます。

仮説②-1 逃走手段の躊躇?

さて、このデータを基に仮説を組み立ててみます。
移動手段が徒歩ということは、不審者は、何かあった場合は走って逃走することになるはずです。

肥満の人は、走って逃げることに不安があるので、もしかして、不審な行動に躊躇するというような面があるのではないでしょうか。

…いや、その場合は、自転車を使えばいいだけやろ、という指摘がありそうですね。
今回、移動手段と体格の関係を新しく見える化してみましたが、実は、肥満の人は、移動手段として自転車を使っていませんでした。小肥でも、自転車利用は3件のみとなっていました。

移動手段と体格(不審者が男性の場合でフィルターをかけています)

そもそも、移動手段が自転車の場合というのが数が少ないので、これも何らかの理由があるのかもしれませんが、肥満の場合は、自転車での逃走にも不安があるのかもしれません。
少なくとも、肥満だからということで、徒歩ではなく自転車が選ばれているといったデータもなさそうです。

さすがに安易過ぎる仮説だとは思いますが、全くの的外れなのでしょうか?

仮説②-2 身体的特徴による躊躇?

次に考えた仮説は、「移動手段に徒歩を選択しているのは車のナンバーを見られたくないからかもしれない」ということをヒントにしました。
自他ともに認める肥満である場合、これが身体的な大きな特徴になってしまうので、自分が特定されやすいという心理的な面が作用するからではないでしょうか。

何言ってんだ、というツッコミがあるかもしれませんが、このデータはどうでしょう。

不審者の頭髪と体格(不審者が男性の場合でフィルターをかけています)

不審者の傾向として、髪型は、特徴がない短髪が多いというデータがありました。今回、これと体格との関係を見たところ、肥満・小肥とも、やはり短髪が多いようです。身体的な特徴は隠したいという心理が働くのではないでしょうか。
う~ん、それとも、これも的外れでしょうか。

移動手段が徒歩であること、短髪が多いことなど、データとしての特徴がありますが、それぞれの理由も判明していません。
この辺り、不審者として捕まった人の証言等から、何かしらのデータを作成してもらえると良いかもしれません
さすがにそれは無理か。という気もしますが、今後の被害軽減のためには、そういう取組があってもいいのかもしれません。

仮説②-3 時間帯の躊躇?

次に考えた仮説は、不審者の情報が16時台に集中していることをヒントにしました。

不審者がどういう理由で行動に及んでいるのかは想像を巡らすしかありませんが、計画的に行為に及ぶ場合と、子どもや女性などに遭遇して衝動的に行為に及ぶ場合があるのではないでしょうか。

一方で、自分もそうなのですが、肥満の人は、ダイエットのために歩いたり走ったりしているところを他人に見られたくないという心情があるかと思います。つまり、もしかしたら、統計的に、肥満の人は散歩やジョギングは人目に付かない時間帯を選択する傾向があるのかもしれません。

何が言いたいかというと、肥満の人は、散歩やジョギングの時間帯が、子どもの登下校時間帯(16時台)と重ならないため、結果として衝動的な行為に及ぶ機会が少ない、という仮説はどうでしょうか?

これも、何言ってんだとなりそうなので、時間帯別データを不審者の体格で分類してみたところ、一番多い16時台に肥満はいないですし、小肥も少ない傾向があります。

不審者の体格と時間帯(不審者が男性の場合でフィルターをかけています)

例えば、ジョギングをする時間帯の体型別データがあったら、この辺りの前提条件の真偽が分かり、この仮説がどうなのかが分かるのかもしれません。

仮説③ 肥満の定義の問題?

以上、少し無理やり発想したものも合わせて仮説をいろいろ検討してみましたが、自分でも、そうかもしれないが、違っている可能性の方が大きいなぁとも思います。
そこで、もう少し違った視点から考えてみます。そもそも論です。

それは、「果たして、どういう体型の人を見かけたら、肥満と認識するだろうか?」という問題です。

肥満の定義は先ほど御紹介したとおり、BMIが25以上の方とされていますが、この不審者のデータでは、通報があった人を掴まえて、一人ひとりのBMIを測定したわけではないと思います。きっと、目撃情報を整理したものではないかと思います。
このため、このデータにおける「肥満」は、厳密な分類ではなく、目撃者による印象だと考えられます。

人は、どこを見て「肥満」と認識するでしょうか。対象のほとんどは、男性です。
一般的には、まず「お腹」で、次は「顔つき」(特にあご周辺かな?)ではないでしょうか。

仮説③-1 お腹が隠れていた?

そうすると、新しい仮説を思いつきました。
パッと見で肥満と分かる「お腹」が隠れていたので、目撃者に肥満と認識されなかった可能性が考えられます。
この場合、例えば、コートを着ていた場合などが考えられます。
ちょっと分析してみましょう。

月別の不審者の体格(不審者が男性の場合でフィルターをかけています)

月別に、不審者の体格を可視化しました。
下段の、月別の体型割合を見てみると、小肥と肥満の割合は、冬時期に低くなっています。また、冬時期には体格が「不明」の割合が増えています
夏時期は薄着になるので、お腹が隠れていないから肥満と分かるけれど、それ以外の時期は、コートなどの上着を着ているため、体型が分かりづらいのかもしれません。

また、データの中に、「不審者の着衣」という項目があったのですが、おそらく通報があったままの情報(暗めの色の上衣など)が文字列として入力されているため、データ形式が揃っておらず、分析ができませんでした。
今後、データ形式が揃えられれば、何か新しい発見をすることができるかもしれません。

仮説③-2 お腹まで見る余裕がない?

よくよく考えると、肥満かどうかって、同じ体型でも、見る角度や服装などによって、大きく印象が左右されますよね。
これまで見てきたデータの中で、不審者に関する情報は「不明」が多かったように、事態に遭遇した方は、きっと驚くのと、逃げる必要があるので、不審者の情報を十分に観察するような余裕がないことが想定されます。

お腹が隠れていた場合と同じで、この仮説の場合も、もしこれが正しいとしたら、肥満が少なかった訳ではなくて、肥満と認識できる事案が少なかったということになるのかもしれません。

仮説③-3 肥満の定義がもっと肥満?

最後は、自分に都合の良い解釈になります(笑)

先ほど紹介したデータで、男性の33%が肥満だというのがありました。3人に1人は肥満です。なので、肥満であることがあまり目立たなくなっている可能性があります。
実は肥満なんだけれど、「う~ん、よくある体型だから、まぁ中肉かな」と、肥満に分類されずに済んでいるということがあるのではないでしょうか。

もしかしたら、他人を見る際に「肥満」だと判断する基準が、「BMIが25以上」よりも緩くなっているのかもしれませんね。
実は、肥満を許容してくれている社会になっているとか。

そうなると、この「肥満」と報告された人は、かなりお腹が出ている人に限られているということなのかもしれません。

この辺りをはっきりさせるためには、例えば、中肉、小肥り、肥満と通報された場合のシルエットなどをデータ化して、比較することができたら、この仮説の真偽が見えてくるかもしれません。

まとめ

さて、私が大好きな作家の一人、井上真偽さんの「その可能性はすでに考えた」ばりに、考えられそうなものをいろいろ検討してみましたが、どうでしたでしょうか。

紹介した作品は、あらかじめ前提条件を全て開示した上で、その条件に基づく推理が繰り広げられ、「なるほど」と思ったら、違う角度から反論がなされ、「なるほど」と思ったら、その反論に基づく更なる推理が続けられるという、精緻で論理的で芸術的な内容ですが、私の仮説は、どれもしっくりこなかったように思います。
どれか一つというよりかは、複合的な要因でもあるかもしれません。

どちらにしろ、まだ何か違う気もしますので、引き続き、データの蓄積を待ちたいと思いますが、その間、他の可能性も考えてみたいと思います。
皆さんはどう感じたでしょうか?
不審者に肥満は少なかったのか、肥満と認識されるケースが少なかっただけなのか。偶然か。違う理由があるのか。

しょーもないことを真面目に書いてみましたが、万が一にでも、有意な仮説に出会えたら、被害の軽減につなげることができるかもしれませんね。