日本酒の製造量と消費量を調べてみた

はじめに

DATA Saber挑戦中です。
Ordで学んだ技術を使って何か分析をしたいと思い、日本酒が好きなので日本酒の製造量と消費量を調査してみました。

データの加工

地域ごとの特徴について分析したかったので、都道府県別の統計データを使用しました。

①都道府県別日本酒消費量

都道府県ごとの日本酒消費量データはこちらのHPから取得しました。
値に「キロリットル」の単位がついており、このままだと使えないのでExcelでデータを加工します。

都道府県と消費量の総数を引用しました


②都道府県別清酒製造量

清酒製造業の概況(平成30年度調査分)|国税庁 (nta.go.jp)

こちらは、以下のようなレポート形式にまとめられていました。
人が見てわかりやすい形ではありますが、このままではTableauに取り込めないためこちらもExcelで加工します。

加工し始めて気づきましたが、セル結合されていたり、文字の間にブランクが入っていたりしたためそれらも全て整形します。


③都道府県別 人口推計

上記から都道府県ごとの年齢別人口のデータを取得します。
お酒に関する分析なので、20歳以上人口のデータのみ使います。

データソースの取り込み

加工したデータをTableauに取込み、都道府県で結合します。

都道府県のカラムが複数できるので、使わないカラムを非表示にします。


Vizの作成

都道府県ごとの日本酒消費量を知りたかったので多い順にソートしました。
さらに製造量との関係性もわかると面白いのではと思いBar In Barで消費量を内包するように表現しました。

また、どの都道府県で日本酒が好まれているのか調べたかったため、計算フィールドの作成で一人あたりの消費量を算出してみました。

ダッシュボードの作成

左から右に視線が行くような配置にしたかったので、地図を一番左に配置しました。フィルターを設定することで、地図の地域を選択した際に地域ごとの結果が表示されるようにしました。

このように地域ごとにフィルタリングされます。

完成系

完成したVizはこちらです。

分析してみてわかったこと

・兵庫、京都の製造量が目立って多いが、消費量はそこまで多くないことから、現地で消費せず県外への出荷量が多いと推測できる。
・東北、北陸など米どころの製造量が少ないことが意外だった。しかし、一人あたり消費量は軒並み上位にランクインしており、特に新潟は飛びぬけて一人あたり消費量が多かった。
・東京都、大阪、神奈川は消費量は多かったが、一人あたりに換算するとむしろ少ない方にランクインしており人口の多さが消費量の多さにつながっていると考えられる。

おわりに

グラフを作る以前に、分析用のデータを探して加工する過程がとても大変でした。特にデータ加工は想像以上に労力がかかる作業だと感じました。

苦労して加工してもVizを作ってみてボツになることもあり、再びデータを探して加工するという段階を踏まなければならないことにかなりの心理的負担を感じました。

このことから、目的を定めてデータを探すこと、そもそも加工しやすい形でデータを管理することの重要さを実感しました。
もし自分がデータを管理する側になった際はできるだけ分析しやすい形になるよう、セル結合をしない、書式を合わせるといった点を意識したいです。


この記事が気に入ったらサポートをしてみませんか?