見出し画像

株式・原油市場におけるオルタナティブデータと予測

こんにちは!DATAFLUCTです。

今回は、DATAFLUCT financial.という「オルタナティブデータを利用した企業業績等の予測サービス」についてお話ししたいと思います。

と聞いても、多くの方は、
・オルタナティブデータってなに?
・企業業績の予測ってどうやるの?
など、疑問がたくさんあるのではないでしょうか。本記事では、それらの疑問を少しずつ解消していければと思っています。


オルタナティブデータとは、三省堂 大辞林には「オルタナティブ=既存のものに取ってかわる新しいもの」と書かれています。

では、そもそも既存のもの・データとは何でしょうか?

株式投資においては、既存のデータ=財務諸表を始めとする一般開示データです。今までは財務諸表を始めとする企業のIRページで開示されているデータをもとに、企業業績がどうなるか予測していた(している)わけです。

それに対して、オルタナティブデータとは、衛星画像、位置情報データ、POSデータ等、IRで開示されているもの以外のデータを指しています。つまり、今までは活用されていなかった業績の先読みデータを使っていこう!というサービスなのです。

でも、衛星画像やPOSデータで業績を予測する?どうやって?

予測するということ

未来を知っている、予測できるってかっこいいですよね。
景気ってどうなるんだろう?あの企業はこの先どうなるのかな?明日って雨降る?等々

ハリーポッターの予言の水晶玉、ロード・オブ・ザ・リングのパランティア、ノストラダムスの大予言など、例を上げればきりがないくらい、普遍的に存在している願望です。

さて、予測とは「将来の出来事や状態を前もっておしはかること」(三省堂 大辞林)と書かれています。

将来の出来事や状態を前もっておしはかる方法は、色々あります。

例1)過去の傾向をそのまま未来に当てはめる

左は線形に予測したグラフです。過去の成長がそのまま続くという予測になっています。売上がこうやって伸びていってくれると嬉しい限りですよね。

それに対して、右は対数で予測したグラフです。だんだん成長幅が小さくなっていっています。売上がこうなっていると、事業責任者は「どうにかしなきゃ…!」と気が気がじゃなくなります。

スクリーンショット 2020-06-12 22.01.26

例2)類似パターンから確率的に考える

天気予報の降水確率のような考え方です。降水確率50%なら、6時から12時までの6時間に「1ミリ以上の雨が降る」と100回同じ予報が出されたときに50回は降ふっているという意味になります。

つまり、過去の似たパターンではこうでしたという確率のお話しです。左は雨降りそう、右は晴れそう‥みたいなことは、私達も天気図を見て思いますよね。

スクリーンショット 2020-06-12 22.02.05

出典:HITACHI

例3)因果関係を元に論理を積み重ねる

風が吹くと桶屋が儲かるのように、X→Y→Z…と因果をつなげていくもの。
(この例は全く信憑性がありませんが)

スクリーンショット 2020-06-12 22.02.37

私達も上記のような予測方法は利用しますが、本サービスの根底にある考え方は少し異なります。

それは、予測・未来を知るとは、
1.他の人が知らない現在のことを知っている
2.他の人が知らない因果関係を知っている
の2つなのではないか、という考え方です。

1.他の人が知らない現在のことを知っている

「Aさんにとっては現在のことでも、Bさんにとっては未来のことである」というのは、どういうときに当てはまるでしょうか?

例えば、Aさんは飲食店を経営しています。
Aさんのお店は、4月の緊急事態宣言の影響で、来客数が昨年比10%まで落ち込んでいます。ただ、通勤時にこのお店の前を通るだけのBさんは、Aさんのお店の来客数がどれくらい落ち込んでいるかわかりません。

ある時、Aさんのお店に「休業します」と張り紙が出されたのを見て、Bさんは初めて「そんなに来客数が落ちていたのか」と知ります。

Aさんのお店が昨年比10%まで落ちている、休業するというAさんにとっての既知・現在のことは、それが張り紙として公表されるまで、Bさんにとっては未知・未来のことだったわけです。

これを株式投資の世界に当てはめると、四半期の決算発表に当たります。発表される業績を知っている人にとって、それは現在or過去のことですが、知らない人にとってそれは未来のことです。つまり、公表されていない現在の状態を推定するという行為は、多くの人にとっての未来を予測することと同義だと言えるはずです。

これを、当事者から聞いてしまったり、財務諸表を見てしまえば、立派なインサイダー取引として違法行為になります。

でも、毎日全国・全世界の小売店に24時間張り付いて、来客数をカウントするのはインサイダーではないですよね?普通の人間には到底無理そうですが‥

このような人間が行うのは難しいことを、オルタナティブデータとテクノロジーを利用してやってみようというのが、私達がやろうとしていることです。

機械学習を始めとする技術進化によって、今までは眠っていたデータを活用できるようになってきている今だからこそ、できるのではないかと思っています。

具体的には、下記のような方法で「まだ公表されていない現在の状況」を推定するということをしているのです。

・衛星画像データから、小売店の駐車場にどれだけ車が来ているかわかる(かも)
・位置情報データから、小売店にどれだけ来客があるかわかる(かも)
・POSデータから、どの商品がどれだけ売れているかわかる(かも)

2.他の人が知らない因果関係を知っている

因果による予測として「風が吹くと桶屋が儲かる」という例をあげました。ただ、あれを読んでも、本当にそうなのか?と思いますよね。それぞれの因果関係の強さも怪しいですし、論理を積み重ねすぎですし‥

では、「衛星画像から定点観測したときに、原油タンクの浮き屋根の影が小さくなっていたら、タンクの原油在庫は満タンになっている」というのはいかがでしょうか?

スクリーンショット 2020-06-12 22.03.50

ご存知の方には釈迦に説法になってしまいますが、原油の備蓄タンクは浮き屋根式といって、貯蔵量に応じて屋根が動く構造になっています(他の構造のタンクもあります)。

これは、貯蔵している原油の蒸発を減らすことで、原油の毀損を減らして、同時に安全性を保つことが目的です。

スクリーンショット 2020-06-12 22.04.25

出典:むつ小川石油備蓄株式会社

つまり、貯蔵量に応じて屋根が動く→衛星画像からタンクの影がわかる→影から屋根の高さがわかる→屋根の高さから原油の在庫量がわかるという関係が成立します。

そして、原油の在庫は原油取引の需給=価格に影響します。4月にマイナス価格になったというのをお聞きした方も多いでしょう。この現象の背景として、原油の在庫量が影響しています(他の要素も複合的に影響した結果ではあります)。

ということで、この原油タンクの浮き屋根の高低が、原油価格に影響するという因果関係がわかっていれば、原油タンクの浮き屋根がXXになっている→在庫量はXXという現在を推定できます。

そして、原油在庫はどの国も週次で発表しているため、その発表前に分かれば、未来を予測していることになるわけです。ちなみに、衛星画像の検索・解析サービスとしては、下記のようなサービスもあります。

また、原油以外でも、「営業職を大量に採用し始めたSaaS企業は、その後売上が伸びるのでは」だったり、「アプリのアクティブUUが急増していれば、売上が伸びるのでは」だったり、オルタナティブデータを活用できる因果関係は、他にもありそうですよね。

そのような、まだ知られていない因果関係を見つけて、原因となる要素の現在の状態をオルタナティブデータで把握することができれば、未来を予測できるのではないか?ということを検証しているのが、DATAFLUCT financial.です。

おわりに

長くなってしまいましたが、DATAFLUCT financialでは以上のようなことをしています。

サービスに興味を持たれた投資家の方、
こんなデータを持っているけど使えないかな?というデータホルダーの方、
未来を予測することに情熱を持っているデータサイエンティストの方、
その他にも、なんかおもしろそうと興味を持たれた方など、ご連絡お待ちしております!