最近の勢いがあれば2030年には車の燃費はリッター84キロになる
アイスクリームの売り上げが伸びると水難事故が増える
知ってましたか?
実はアイスクリームの売り上げが伸びると水難事故が増えるんです。
「それって因果関係あるの?」とパッと思った方はさすがです。
これはいわゆる擬似相関ってやつですね。
データ分析をする上で気を付けておかないと結構陥りがちなミスです。
今回はそんなデータ分析で陥りがちなミスをむしろネタとして扱い2030年の燃費を調べていきたいと思います。
最近の勢いがあれば2030年には車の燃費は84km/ℓになる
最近はガソリン代もなかなか以前のような金額には戻らず、
もはや今の金額で定着していきましたね。
ガソリンの金額が上がったいま、
燃費は車選びの大切な1つのポイントになっていきます。
そこで今回は、公開されている車の燃費のデータから将来の車の燃費を予測していきたいと思います。
使用したデータ
▼国土交通省 ガソリン乗用車のJC08モード燃費平均値の推移
ちなみに、JC08モードとは燃費の測定方法の1つで、2011年から2021年ごろまで主に使われていた測定方法になります。
元々は「10・15モード」という別の燃費測定方法があったのですが、あまりにも実燃費との誤差が生まれたので実燃費に近づけるためにJC08モードでの測定方法に切り替わりました。
ちなみに最近は、世界統一のWLTCモードという燃費の測定方法に変わったのですが、こちらはデータ数があまりにも少なすぎた(2件のみ)ので、今回はJC08モードでの燃費データを採用します。
実際に計算してみる
では実際に上記のデータを使用して、直近の車の燃費がどのように推移しているのか見ていきたいと思います。
(ちなみにデータは全部で11件です😇)
それぞれの年数に対する平均燃費をグラフにプロットして、
なるべく似ている(適合度の高い)曲線を求めていきたいと思います。
パソコンにお願いしたら、全部でやってくれました。
青い点が実際の年と平均燃費で、赤い線が近似曲線です。
そして、適合度が0.98(最高は1)なので、
かなり適合度が高いことがわかります。
そして、上記で出力された回帰式に2030年を当てはめてみます。
2030年を当てはめてみると84.4km/ℓに。
今の倍以上の燃費です。
もはやSDカードの容量レベルの推移です。
今回の数値は果たして正しいのか
今回の数値は果たして正しいのか?
2030年には燃費が84.4km/になることは100%ないかと言われたら、
それは僕には分かりません。
サンプル数が少ないので、サンプル数を増やしたときに
本当に適合度が高いのか分かりません。
今回は近似曲線が三次関数にかなり近かったのですが、
サンプル数を増やすことでもっと複雑な曲線になるだろうと考えられます。
これがデータ分析をする上で気を付けなければいけない
「サンプル数不足」ってやつです。
ここで「それでは適切なデータサイズってどれくらいなのか?」という疑問が生じると思うので、これに関してはまた別記事で詳しく紹介したいと思います。
つづく
偏愛とマーケティング研究所について
偏愛とマーケティング研究所では、データの集め方、現場で活用できるデータ分析の方法を紹介しています。 「データを活用したいけど、そもそも何をしていいのか分からない」 なんて方もお気軽にご相談ください。
この記事が気に入ったらサポートをしてみませんか?