山手線 どの駅がよく使われているかのオープンデータを可視化してみる
東京の駅は個性的だが、地方出身の私は正直よく知らない
上京して今年で5年目になる。
わたしは愛知と大阪での暮らしが長いが、そのどちらの都市とも東京は違う。とくに違いを感じたのが東京での「駅」とそれに対する「意識」だ。
東京の駅はそれぞれに個性があり魅力的だ。
地方出身の私の感覚からすると、市や県の話をするときと同じようなニュアンスで駅の話が使われる。
「〇〇ってどこ住み?」「めっちゃ分かる!!高円寺っぽい~!!」というように。
この関東においては、どこの駅に住むのかはその人の属性の一つでもあるらしい。
ところが私はその駅の個性を知らない。
高円寺っぽいと聞いても、寺があるのだろうというぐらいしか感じない。
正直、どこが大きい駅なのかすら よく分かっていない。
これは常識知らずだろうと、せめて大動脈の山手線のことだけでも理解するため、データを見ることにした。
JR東日本のデータから可視化
そこでさっそく無料のデータビジュアライズツール、Tableau Publicで作ったみたのが次の図表だ。データはJR東日本のオープンデータ等をお借りした。(詳細後述)
1日平均乗車客数という「どのぐらいの乗客がその駅から電車を使っているか」を把握する数字をもとに、駅の規模感を比較する。グラフとともに、地図へのマッピングを作成した。データが2019年なのでまだ高輪ゲートウェイはない。
乗車客数が多い順にランキングを作成した。多いほど色が赤くなる。
マッピングは、駅を利用する方が多いほど円が大きくなるように配置した。
新宿が代々木と新大久保を飲み込んでいる。円の中心が実際の駅の位置だ。
おそらく順当に常識的な数字が並んでいるのだと思うが、私は正直なところ驚いた。
天下の東京駅がまさかの3位。
そして池袋が2位に来るほど大きいとは夢にも思っていなかった。
今すぐ自分のイメージを撤回して頭の中を塗り替えなければいけない。世間知らずもいいところだ。
そしてグラフで一目でわかる規模の違い。ちょうど真ん中にいる五反田の14万人からすると、池袋は4五反田。新宿は5.5五反田になる(言いたいだけ)
一口に山手線といっても、そこには大きな規模の違いがある。
余談だが、愛知にある私の実家の最寄駅は2,500人/日だった。
おそらく新宿駅の1改札にも到底満たなくてかなしいが、最下位の鶯谷駅の一番使われていない改札なら勝負になるかもしれない。ならないか。
こうして数字を見ることで、不思議とその駅自体にも興味が湧いてくるから面白い。とりあえず近いうちに池袋へ行こうと決意した。
進むデータの公開「オープンデータ」
さて、先ほどの帳票は思い立ってからデータを集め、トータル20分ぐらいで作ることが出来た。これは私だからできたわけでは全くない(むしろ遅い方だろう)。
もちろんBIツールのTableau Publicの力によるものはとても大きいが、こうして簡単に物事を調べられるのは間違いなくオープンデータのおかげだ。
「オープンデータ」はデータを公開し、二次利用することで価値を生み出すという一連の取り組みを指す。
官民データ活用推進法によって国も自治体も大いに取り組みを進めており、単なるデータ公開だけでなく分析データの共有も盛んだ。さいきんではV-RESASという新型感染症の影響を可視化したものが非常に興味深い。
今回は使用したデータは民間であるJR東日本のIR情報だ。99年からのデータが蓄積されているので、20年来の変化を見てみるのも面白そうだ。
オープンデータを掛け合わせて分かりやすくする
オープンデータは素晴らしい取り組みであり、それだけでたくさんの情報を持っている。取り組みが進んだ結果、現在オープンデータは世の中に無数に存在する。
こうしたデータは「掛け合わせる」ことで、「もっと分かりやすく」使うことが出来る。それによって、ひとつのデータだけでは届かなかった気付きを私たちに与えてくれる。
先ほどのJRのデータは「東日本管内すべて」の駅のデータとなっているため、山手線で絞り込むのはちょっと大変だ。私ぐらいだとそもそも山手線の駅をすべて知らない。
そこで山手線の駅名一覧と掛け合わせることでフラグをつける。
これによってVLOOKUPで簡単に「山手線だけ」のランキングを作ることが可能だ。こうした掛け合わせるデータも有志によってオープンデータ化されている。
(個人的にVLOOKUPのときはIFERRORを添えるのが好き)
また駅を地図にマッピングすることも、データの掛け合わせによって実現できる。
これには「住所を入手」して「緯度経度へ変換する(=ジオメトリという)」作業が必要だ。
▼Geocording and Mapping(住所を緯度経度に変換する)
▼LinkData - 日本の駅データ
これも同じようにVLOOKUPで乗客数の表と掛け合わせてあげれば、簡単にマッピングが可能だ。
データを楽しむことで毎日はもっと豊かになる
データというとどうしても仕事や学問のイメージがあるが、そんな縛られるものではない。まじめなことにしかデータを使ってはいけないという決まりは何もない。
私は「事象の複数形がデータである」という言葉がとても好きだ。
あくまでデータは記録の積み重ねだ。新宿駅で1人が電車に乗る。乗客数は1だ。これが1日に77万回繰り返されて先ほどの1位の数字になる。
なぜ77万人も乗るのか、そんなことを考えて、お酒を飲みながら話すだけでもちょっと面白い。
知的好奇心は人生を豊かにすると思う。ある物事が起こること、そしてそれをかき集めたデータは「なぜだろう」の塊だ。
せっかく無数のオープンデータが公開されている現代、まじめなことに使うだけではもったいない。お金はかからない。わくわくは得られる。
ぜひ「データを楽しむ」ことで毎日を豊かにしてほしい。
この記事が気に入ったらサポートをしてみませんか?