UFO目撃レポート件数をデータ分析してみた
調査・分析:RMR(Rosso Machinelearning Reportage)
導入
今どきUFOなんて誰も信じてないでしょ?と思った
かつてCGIは大金をかけたハリウッド映画などの限定的なものだったが、今ではマシンスペックも向上し、小学生がAdobe PhotoshopやBlenderによる驚くような作品をSNSに公開する・・・といったことも珍しくない。
またグラフィック系の技術が無くともDeepFakeで作られる本物と見分けが付かないフェイクニュースだの、海外のYoutuberが作ったbotが人間と見分けのつかない数万の投稿を行っただの、人類はあまりに嘘が上手くなりすぎてしまった。
こんな時代に、誰もUFOなんて信じてないでしょ?
と考えたのが調査のキッカケだった。
では実際にUFOのデータを見てみる
UFOのデータとはどんなものがあるのか?そもそも存在するのか?
と思いきや、もの凄いデータが保管されているサイトがすぐに見つかった。
National UFO Reporting Center(NUFORC)とはアメリカの情報機関で、1974年に設立以降、一般からUFOの目撃レポートを集めており、現在では合計15万以上ものUFO目撃レポートを保管している。
それらのレポートはホームページで一般公開されている。
なんと1970年代当時のUFO目撃を報告する通話記録を聞くことも可能(リンク)
UFOに関する記事や先行研究などで使われているのはこのNUFORCのデータであることが多いらしい。
データに含まれていたのは以下の項目である。
都市名,州
緯度経度
時刻
UFOの形
目撃できた時間の長さ
報告内容
さっそく全体のUFOレポート件数の推移を確認したところ、以下のようになっていた。
「今の時代、誰もUFOなんて信じてないだろう」
という仮説は外れており、
むしろ1990年から大幅に増加し、2010年以降も更に増加しているのがわかった。
これはなぜなのか。今回は主にUFO目撃レポート件数について調査を行うことにした。
UFO目撃レポート件数増加の理由とは!?
分析1. 1990年代からのUFO目撃レポート件数増について
90年代前期までは1ヶ月あたり30~50件程度だったUFO目撃件数が
90年代後期から200~400と急増している。これはどういうことか?
宇宙人が活発に地球を訪れるようになったのか?
もちろん違った。
NUFORCのホームページには以下のような記述がある
つまり、90年代後期からのUFO目撃レポート件数増加は、
それまでは電話によるホットラインや郵送のみで受け付けていたUFO目撃レポートが、1994年からNUFORCのホームページでも受け付けるようになったためである。
あまりに単純な事実だが、これを無視して
「1990年以降UFO目撃回数が爆発的に増加していることが判明!」
などと書いている記事を見かけるので注意が必要だ。
今の世の中のように、ネットサーフィンしながらYoutubeで動画を垂れ流ししつつスマホでソシャゲのデイリー消化やSNSを閲覧するような状況とは全く異なり、
1994年当時は低速ダイヤルアップ接続で数分10円という時代だった。
せっかく「UFOだ!!UFOを見た!!」と興奮しても、ダイヤルアップ接続するハードルを前にしてNUFORCへの報告を諦めるか、またはダイヤルアップ接続音を聞いているうちに「いや、あれは飛行機か人工衛星だろう」と冷静になってしまったのかもしれない。
ちなみに、当時のインターネット普及率は、1997年の時点で20%に満たない程度だったようだ。
インターネットでNUFORCにUFO目撃レポートを送信できるようになったとはいえ、かつてはインターネットという手段そのものを扱える人間は少なく、UFOを目撃してもレポート件数として計上されなかったのだろう。
分析2. 心理社会的仮説「世界情勢が不安定になるとUFO目撃が増える」について
「世界情勢が不安定になるとUFO目撃が増える」というような説、聞いたことがある方も多いのではないだろうか?私もその一人だった。
いい機会なのでこの説について調べてみたところ、
UFO研究におけるPsychosocial hypothesis(心理社会的仮説)
が元になっているようだ。
ざっくり以下のようなことが書かれていた。(英語が難しいのと、ソース元までたどる元気がなかったので、間違いはご容赦ください)
心理社会的仮説はイギリスのUFO研究雑誌Magoniaにて「1954年フランスのUFO大量目撃は国の敗北と政府の危機の時期に発生した。UFOと急激な社会的変化には関係がある」のような記述があり、広まったとされる。(1954年はベトナムとフランス間の第一次インドシナ戦争終結)
なぜUFOといえば「円盤」なのか?もともとは"Well, they flew erratic, like a saucer if you skip it across the water.”「なんか・・こう・・・ふらふらしてたんだよ!ちょうどコーヒーの受け皿が水の上をふらふらする感じさ!!」という目撃者の証言でsaucer(コーヒーの受け皿)は物体の動きの例えとして用いられていたが、その物体の形がsaucerだったかのように受け取られ広まった。それからUFOの目撃者は物体が円盤だったと語るようになった。
かつては空を飛ぶものといえば飛行船だったため、1910年代まではUFOといえば、葉巻型が主流だった。それから飛行機が登場して飛行機型になったりロケット型になった。
差し迫った戦争、政治的軋轢などでスパイがいるんじゃないか?のような(スパイフ○ミリーみたいな)ムードになっていて民衆は疑心暗鬼になっていた。そのためUFOを目撃したと証言する人が現れたときは、「おれは謎の飛行物体を見た!きっと某国のスパイが侵入してきたに違いねえ!」というニュアンスだった。UFOには宇宙人が乗っているというのは1940年代以降の発想か。
(他にも心理学者のユングがUFO信奉者として勝手に引用されていたとか、それに対してユングが勝手に引用されて怒ったとかいろいろあったらしいが、ユングの言い回しが捻くれていてよくわからなかったので各自ググってほしい。意味はわからないが、非常に興味深いので)
個人的には不思議と説得力があり、非常に興味深い気がする。
心理社会的仮説は1950年代頃に登場したものとわかったが、では近年も同様に心理社会的な影響によってUFO目撃レポート件数の説明がつくのだろうか?
近年のUFO心理社会的仮説の確認
アメリカのUFO目撃に影響するような事件として以下のようなものが思い浮かんだ。
1914~19年:第一次世界大戦
1939~45年:第二次世界大戦
1947~89年:冷戦
1955~75年:ベトナム戦争
1990~91年:湾岸戦争
2001年:世界同時多発テロ
2008年:リーマンショック
2020~:COVID-19
私の方で思いつく範囲で挙げてみたが、NUFORCのデータは最も古くて50年代のため、世界大戦のころのデータは存在せず。冷戦の時代は電話と郵送のみの受付なのでレポート件数自体は少ない。
では94年以降はどうだろうか?
2001年世界同時多発テロ
1994~2014年は逆に一般からのUFO目撃レポート件数の経年増加に埋もれてしまっている。2001年9月11日世界同時多発テロの前後のみプロットしてみると、911当日にUFOを目撃したというレポートは増えてはいるようだ。
たしかに、2001年当時は世界貿易センタービルが崩れる映像にUFOが写っているだの、ビル崩壊の白煙が悪魔の顔に見えるだの、テレビで特集されていたのを思い出す。(この頃はテレビでオカルトを取り上げるのが今に比べてメジャーだった。)
しかし、広い範囲で見ると2001年9月11日を前後にレポート数が増えたということもなく、6~9月頃のUFO季節変動(Travis Greene, 2018 下図)の影響の方が強いように思える。
2020年3月~ COVID19
COVID-19前後のUFO目撃レポート件数についても見てみた。
私も最初は「2020年にUFOレポートが急上昇したのはコロナなのだよ!!!」と社内の方々に熱弁してしまったが、あきらかにコロナ以前からUFOレポートが増加している。
コロナ禍の数ヶ月前後を一日ごとのUFO目撃レポート件数で確認してみた。
前後だけみてもあまり大きく変動しているようには見えない。2020年4月~5月あたりの30日移動平均を見ると「コロナ禍で孤独な心がUFOを見せたための増加」と言い張ることもできるかもしれないが、5月にはもう減っている。
後に2020年前後の大幅な増加は、人工衛星の急激な増加が原因らしいとわかった。2010年頃に比べて2020年には活動中の人工衛星の数が3倍程度まで膨れ上がっている。
UFOと人工衛星の見間違えは非常に多いようで、NUFORCの受付ページにも、
「もしかしてスターリンク衛星との見間違えじゃありませんか?」
という注意表記があった。
2020年のピーク以降のUFO目撃レポート件数の急減は
この注意表記のためかもしれない。
なぜ2014年にUFO目撃レポート件数はピークに!?
こうして近年の事件とUFOレポート件数をいくつか見比べて見ると、
「世界情勢が不安定になるとUFO目撃が増える」という心理社会的仮説は、
数日間~1ヶ月程度のスケールでは言えなくもないかもしれないが、年単位で影響を与えるとは考えにくいように思える。
UFO目撃レポート件数は、もっと大きな要因の影響を受けている気がしてならない。
しかし、件数は2010~2011年ごろから増え、2014年ごろに最大のピークに到達し、その後2019年まで大きく減少している。
これはなぜなのか?
「我ら、スマホによってUFO目撃を伝え、スマホによってUFOを見失う」説
NUFORCのホームページ受付が1994年に開始し、インターネット普及によって増加したというのを踏まえると、
2010~2014年に件数が増加し、その後に減少した理由が思い浮かんだ。
スマホ仮説1:スマホ普及率の向上→件数増加
2007年。AppleからiPhoneが登場して以降、
スマートフォンはそれまでのケータイ以上の性能を発揮しているだけではなく、PCやブロードバンドを持たない世帯や、貧困層に対してはライフライン以上の力を発揮しているという。
かつてはUFOを目撃しても、事情によってレポートを送信できなかったような人でも、スマホの普及によって徐々に可能になってきたのではないか?というのがスマホ仮説1である。
スマホ仮説2:スマホ閲覧時間の増加→件数減少
アメリカの調査結果など見てみると、
調査機関による多少の差はあれど2012年に比べて2時間以上増えているらしい。
スマホが登場した直後は「メール・電話・ネット+α」程度のものだったがAppStoreやGooglePlayからアプリをダウンロードすることで、PC以上に何でもできるようになった。
2010年頃からは、いわゆるソシャゲが台頭しはじめた。
アメリカモバイルゲームの市場規模も2011年から10倍以上に拡大。徐々にスマホのスペックも向上し、かつてのコンソールゲーム機以上のゲームを基本無料で遊べるようになってしまった。
Twitter,Facebook,InstagramなどのSNSも文化として定着し、大人も子供もお姉さんも、どいつもこいつも通勤時間も休憩中も移動中ですらスマホばかりを見るようになった。
ところで、UFOのゴールデンタイムは19時~24時頃で、この5時間に1日の54%が集中している。
アメリカでも勤務時間はだいたい9時~17,18時とのこと。 誰もが仕事中は絶対スマホを見ていないと考えるのは難しいが、貴重なUFOのゴールデンタイム中に2時間もUFOのいる空ではなくスマホなんかを見ていたら、間違いなくUFO目撃レポート件数も減ってしまうだろう。
人類はUFOがいるかもしれない空よりもスマホばかりを見るようになり、UFO目撃レポート件数が減ったのではないか? というのがスマホ仮説2である。
検証:UFO目撃レポート件数モデルを作成
これまでの仮説をもとにモデルを作成して検証してみる。
インターネット普及がUFO目撃レポート件数を増やした
スマホの普及がUFO目撃レポート件数を増やした
スマホの閲覧時間増加がUFO目撃レポート件数を減らした
以上の仮説をもとにpymcライブラリによってUFO目撃レポート件数モデルを作成してみた。
UFO目撃確率(万人月当たり):ベータ分布
「スマホ閲覧時間」によってUFO目撃確率が減少する。というのを二項分布の共役事前分布であるベータ分布で表そうとした。
しかし、pymcで実際にベータ分布で行おうとしたところ、過学習したり、または当てはまりが悪くなってしまったので(pymcの何かの仕様を見落としている?)、「スマホ閲覧時間がUFO目撃確率を下げる」という性質のみを再現させるためにベータ分布の期待値α/(α+β)をそのままUFO目撃確率として使用した。UFO目撃者数:二項分布
n=アメリカ人口、p=UFO目撃確率とした二項分布で算出する。アメリカ人口は1994年か2019年まで25%増加しているため考慮に入れた。しかし、アメリカ人口はそのまま扱うと数値が多すぎるため対数尤度計算でエラーとなるため、1万人あたりの目撃者数二項分布として扱った。レポート送信件数:二項分布
n=UFO目撃者数、p=レポート送信確率とおいた二項分布にすることで、UFOを目撃した人間が実際にNUFORCにレポートを送る確率をモデルに組み込んだ。
UFO目撃レポート件数モデルのために追加したデータと入手先は以下の通り
不足分は線形補間している。
使用するUFOレポートの期間は1994年1月~2019年1月とした。
pymcによるモデル構築
import arviz as az
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import pymc as pm
import japanize_matplotlib
basic_model = pm.Model()
with basic_model:
#UFO発見しにくさ調整パラメータ
sky_alpha= pm.Gamma("sky_alpha",alpha=2,beta=1,shape=1,testval=[10])
#UFOの目撃しにくさに影響
ufo_sky_beta = pm.Deterministic("ufo_sky_beta",
sky_alpha/(1-data["spendtotal"].values * data["smartphone"].values)
)
#二項分布の共役事前分布ベータ分布。を使用したかったが、過学習してしまったので期待値a/(a+b)のみ使用
p_witness = pm.Deterministic("ufo_sky_alpha",1/(1+ufo_sky_beta))
#二項分布でUFO目撃者数の導出。対数尤度計算でpymcがサイレントオーバーフローしたので人口を10000で割っている
ufo_witness = pm.Binomial("ufo_witness",n=data["population"].values//10000,p=p_witness)
#UFOを見たところでレポートするか否か
#スマートフォン所有者のレポート係数
smart_alpha = pm.Uniform("smart_alpha",lower=0,upper=1,shape=1,testval=[0.3])
#インターネット所有者のレポート係数
internet_alpha=pm.Uniform("internet_alpha",lower=0,upper=1,shape=1,testval=[0.2])
#持っていなくてもレポートする確率
none_alpha=pm.Uniform("none_report_alpha",lower=0,upper=1,shape=1,testval=[0.1])
#UFOを目撃した人がレポートする確率,一応強制的に0より大きく1までの範囲におさまるようにする
p_report = pm.Deterministic("est_report",
pm.math.clip(smart_alpha * data["smartphone"].values \\
+ internet_alpha * data["internet"].values \\
+ none_alpha
,0.0001, 1)
)
#二項分布でUFO目撃レポート件数の導出。
ufo_report = pm.Binomial("ufo_report",
n=ufo_witness,
p=p_report,
observed=Y_rolling)
pm.model_to_graphviz(basic_model)
モデルを組んだあとにすぐ推論を進めようとすると、Initial evaluation of model at starting point failed!エラーになることがある。これは対数尤度が-infになったときに起こるようなので、testvalを設定しつつbasic_model.check_test_point()で-infが存在しないか確認したほうが良い。
(今回はアメリカ人口を1万人毎で扱うことで解決できた)
basic_model.check_test_point()
"""
{'sky_alpha': -5.39,
'sky_beta': -1.0,
'ufo_witness': -1418.24,
'smart_alpha': -1.56,
'internet_alpha': -1.83,
'none_report_alpha': -2.41,
'ufo_report': -23745.0}
"""
対数尤度で-infが存在しなければそれなりに無理のないモデルとなり、推論を進めることができる
with basic_model:
trace = pm.sample(
1000,
step=pm.NUTS(),
progressbar=True
)
結果確認
推論を終えた結果がこちら。
1994年から2007年頃まではゆるやかな上昇。スマホが登場してから更に加速
し、2014年をさかいに減少するような推移が再現できた。
それまで気づかなかったが2010年、2011年は夏以外の季節でUFO目撃レポート件数が少なかったようでそのあたりは当てはまりがよくないのが惜しいが、
インターネット普及率・スマホ普及率・スマホ閲覧時間でUFO目撃レポート件数の推移が説明ができるかもしれないという説について、当たってるのでないか?という思いが強まった。
モデルがどのような値を算出したのか詳しく見てみる。
UFO目撃確率(1万人月当たり)
スマホがない時代のUFOの目撃確率は1万人あたりで50%。つまり一人あたり0.005%程度ということらしい。(後述するが、値の推移・比率には意味があるが、50%という値自体には何の意味もない)
これがスマホの影響で、2019年にはかつての3分の1程度まで減少してしまった。
UFO目撃件数
期待値としてはUFO目撃確率×アメリカ人口=UFO目撃件数となる
2010年ごろまではアメリカ人口の増加にしたがって単調増加。
それ以降はスマホ閲覧時間による影響で減少。
レポート送信確率
レポート送信確率に関係のある各ハイパーパラメータは以下のようになった。
インターネット普及によるレポートウエイト:0.1985
スマホ普及によるレポートウエイト :0.3022
絶対レポートする人のウエイト :0.0056
インターネット普及によって人は0.1985/0.0056=約35倍UFO目撃後にレポートするようになり さらにスマホを所有していれば(0.1985 + 0.3022) / 0.1985 = 約2.5倍近くレポートするようになるらしい。
上記3つの値によってUFO目撃レポート件数は、
UFO目撃者数 = UFO目撃確率 × アメリカ人口
UFO目撃レポート件数 = UFO目撃者数 × レポート確率
と導出される。
UFOモデルの問題点
このモデルの問題点としては、
1.「1994年以降で発生し、増加傾向にあるデータ」
2.「2012年以降で発生し、増加(減少でも可)傾向にあるデータ」
の2つを組み合わせると、多分どんなものでもUFO目撃レポート件数を再現できてしまうことだ。
多分、スマホ普及率とスマホ閲覧時間の代わりに
日本人の味噌汁の摂取量
日本人の魚介類消費量
居酒屋・ビアホールの売上高
ブラジルのとうもろこし生産量
司法書士試験合格者数
サザエさんの視聴率
Internet Explorer の使用率
などを組み合わせてもUFOのモデルを再現できてしまうかもしれない(試していないが)。
また、モデルはあくまでUFO目撃レポート件数を目的変数として推論を行っているが、この値は、
UFO目撃者数 = UFO目撃確率 × アメリカ人口
UFO目撃レポート件数 = UFO目撃者数 × レポート確率
で成り立っている。しかし、上記のUFO目撃確率とレポート確率には何の仮定も設定されていないため、今回のモデル計算で算出されたこの2つの値には何の意味もない。例えばUFO目撃確率を100倍に見積もってもレポート確率を100分の1にしてしまえばモデルは最終的に同じUFO目撃レポート件数を出力してしまう。
(先程10000人月当りのUFO目撃確率がスマホ出現以前は50%となっていたが、この値自体には何の意味もない。できればレポートされる前の純粋なUFOを目撃する確率を算出してみたいが、方法が思いつかなかった)
感想・まとめ
軽いノリで始まった調査だったが、UFOのデータには人類の歴史・文化・科学技術・心理的背景が複合的に投影されているらしいというのが垣間見えて非常に興味深かった。私自身はどちらかというと全くUFOを信じてはいないはずだが、最早UFO自体の魅力に取り憑かれているのと何が違うのだろうと感じている。
データサイエンティストとしても、得られたデータを信じること、データに含まれるバイアスが非常に危険だということも実感できた。思いもよらぬ影響があるかもしれないため、結論を急ぐのは危険。調査・分析には十分な時間が必要だと改めて実感した。
今回はUFOの存在を証明あるいは否定するようなものではなく、あくまで「近年のUFO目撃レポート件数の推移をどのように説明するか」にのみ焦点を当てている。NUFORCのデータは他にも様々な観点から研究されているので面白いと感じた方は是非ご自分でも調べてみてほしい。
もともと「スマホやCGの発展で、UFO写真や動画をみんな信じなくなってるはず」と思って開始した調査だったが、スマホの影響でUFO目撃レポート件数が増えたという一面が出てきたのは意外だった。
あのUFO目撃レポート件数の推移を説明することができる要因やモデルは他にもあるだろうが、個人的には自分の説はいい線いっているだろうと思っている。
先行研究
興味深い内容が多いため、一部を箇条書きで紹介させていただく。
Travis Greene, "Data Analysis: Everything You’ve Ever Wanted to Know about UFO Sightings" (Jul 3, 2018)
R言語による分析
目撃されたUFOの形状について、単語別にツリーマップ
地域ごとのUFO目撃件数の推移
6~7月など、温かい時期にUFO目撃件数が多い
土日の目撃件数が多い
UFO目撃件数はほぼ地域の人口に比例しており、人口が少ないがUFO目撃件数が多い地域などは存在しない
Mark J. Carlotto, 2021. A Preliminary Analysis of Historical UFO Report Data
https://www.researchgate.net/publication/352352112_A_Preliminary_Analysis_of_Historical_UFO_Report_Data (アドブロックにひっかかります。注意)
アメリカの人口増加以上にUFO目撃レポート件数が多いことについて言及
季節変動について隕石の活動との比較
州の人口と目撃件数の関連
The Canadian UFO Survey, "The 2020 Canadian UFO Survey"
http://www.canadianuforeport.com/survey/essays.html
カナダのUFO研究機関による調査レポート
レポートごとの信頼性(Reliability)についての記述あり。証人へのインタビュー、複数の証人の有無、詳細な調査の有無によって信頼性が決まる。
カナダは6~8月の三ヶ月は白夜があるためUFO目撃件数は減る様子。(下図)
Rossoで一緒に働くデータサイエンティストを募集しています!
RossoのAI・データ分析技術部では、どんな題材でも取り組みを共有し、知的好奇心を持って挑める環境・仲間がいます。気になる方はぜひ採用ページをご覧ください!
https://www.rosso-tokyo.co.jp/recruit/