人間の一生はAIによって予測できる!と言うのはまだ早すぎるかもしれない
こんにちは、おがくずにゃんこです。
※本記事は無料で全文読めます。もし参考になりましたら最後にコーヒー一杯分ほど寄付いただけると励みになります。
今回は学術記事の紹介です。
少し前にX (旧Twitter) を賑わせた記事なのですが、実際のところどのくらい凄いのか気になったので原文を読んでみることにしました。
論文自体が非常に面白く、なんとあのChatGPTに着想を得た部分もあるということで、論文の概要と個人的な考察をまとめたいと思います。原文は以下のarXivからアクセスできます。
使用したデータ
今回紹介する論文「Using Sequences of Life-events to Predict Human Lives」は、デンマーク工科大学が出版したものです。日本でいうと東京工業大学のような位置付けの大学といえるでしょう。
そこで使用されたデータとしては、デンマークの国民健康登録簿 (Danish national registers) に保存されている、2008年から2015年12月までの35-55歳の疾患情報データ2,301,993件です!(とても多い)疾患情報データには、病名とステータス(罹患中、回復)が記されています。
また労働者データベースも使用しており、居住地区、収入、業界、役職といった情報も使用しています。
構築したモデルと検証結果
ChatGPTモデルに着想を得た、Multiple Stacked Encoderモデルを使用しています。ざっくり言うとChatGPTではテキストデータを入力として受け取り、それに対する適切な答えとなるテキストデータを出力していますが、構築したモデルではライフイベントを入力として受け取り、それに対して何かしらの予測を出力とするモデルです。論文内では「life2vec」モデルと呼んでいます。
構築モデルはエンコーダーデコーダで構成されるモデルです。これがどのようなものなのかについては、以下ページの図がとてもわかりやすいです。
最初のエンコーダは各ライフイベントのイベントデータとポジショナルデータ(年号や年齢)を入力として受け取ります。この受け取るデータというのはベクトル表現のデータとなっており、ポジショナルデータのような時系列情報はtime2vecという手法を用いてベクトル化しています。time2vecについては以下記事(英語)が詳しかったです。
エンコーダにはReZeroという形式を採用しており、最後にデコーダが予測を行います。
本モデルを使用して死亡率を予測したところ、リカレントニューラルネットワークやニューラルネットワークによるモデルよりも高い精度となりました。また死亡予測には疾患の有無、年齢、収入に依存していそうだということがわかりました。
個人的な考察
まず、このような論文が出版されたことで「人の一生はAIによって予測される!」というディストピア的な発想が生まれがちですが、そのような未来にはもう数段研究を重ねる必要があることがわかります。
まず30歳ー55歳というある程度職業が固まっている年齢層のデータを使っていることが前提としてわかります。それによって得られる結果というのも、ちょっぴり切ないですが「死亡予測」というシンプルな尺度であることがわかります。
ただ研究的な視点で見ると、230万件という膨大なデータから得られた知見ということで確度が高そうですし、最新モデルを見出しているという点で価値が高いと思います。Natureに掲載される論文なだけあって凄いですね(小並感)。
またこの結果を裏返して考えると、30歳時点で選択した職業や会社、またそれらによって得た能力というのは、その後の人生をほぼ決定づけてしまう、ともいえます。まあ今回は死亡予測だけですが。
ここから「そもそも人生の予測にどういう意義があるのか」という点の考察ですが、私はもっと世の中で予測を活用するべきだと思っています。今回の論文では「死亡率」を予測していますが、例えば不摂生な生活を送っている人に対して「あなたはこのままだと10年後には90%の確率で死にますよ」のように診断結果を伝えれば、単に「あなたは不健康な食事をしているので栄養バランスに気を付けましょう」みたいな当たり障りのないアドバイスよりも改善意識が芽生えるように思います。
予測を活用するというのは、一般人にとってもわかりやすいのは確実です。例えば将棋の世界では、プロ棋士の対局に「評価値」という判断が表示されるようになったことで、将棋のルールが良くわからない人でも楽しめるようになり、将棋がより盛り上がるようになりました。
他にも今回の予測技術を応用することで、「あなたの生涯年収は90%の確率で3億円です」のような予測をもっと伝えて良いと思います。予測はあくまで予測であり、未来をつくるのはその人自身なのですから、それを生かすも殺すもその人次第です。具体的な数値が示された方がモチベーションが高まる人というのは、意外と多いように思います。
今回の記事は以上です。これからも面白い論文があれば紹介したいと思います。もしためになったのならコーヒー一杯分ほどの価格で購入いただけると励みになります。
ここから先は
¥ 100
この記事が気に入ったらサポートをしてみませんか?