見出し画像

オープンデータ活用研究vol6(経済センサス編) 京都市おける飲食業の収益性分析から得られる新たなインサイト探索~データ収集編~

お疲れ様です。ムロイです。
皆様、いかがお過ごしでしょうか。
季節はすっかり春の季節、首都圏では桜のピークも過ぎて、入学式や入社式などを経て新生活をスタートしている皆様おめでとうございます。
また不確実性の高い世の中でこの春から新たなチャレンジをスタートさせている皆様も心から応援しています。一緒に頑張っていきましょう。

前回、前々回では京都市のオープンデータから様々な視点で飲食業、宿泊業の現状を見てきました。ただ分析結果が外観理解はできたものの、もう少し事業者視点で深堀を行いたいと思いましたので、今回から経済センサスデータを使用して、そもそも京都府の飲食業、宿泊業が一体どのような収益性を持って経済活動を行っているのか見ていきたいと思います。Withコロナ時代となり、また観光産業の復興を遂げるためには日本の観光産業の代表格である京都が非常に重要だと感じています。データ分析から何か新たなインサイト(気づき)を得られないかいろいろと検証していきます。
まずは、データ収集編になります。


経済センサスデータとは?

総務省統計局が提供する経済センサスデータ

総務省統計局が提供するオープンデータになります。
当該ホームページでは経済センサスの目的を以下のように定義しています。

経済センサスは、事業所及び企業の経済活動の状態を明らかにし、我が国における包括的な産業構造を明らかにするとともに、事業所・企業を対象とする各種統計調査の実施のための母集団情報 を整備することを目的としています。

経済センサス

経済センサスは、
・事業所、企業の基本的構造を明らかにする「経済センサス‐基礎調査」
・事業所、企業の経済活動の状況を明らかにする「経済センサス‐活動調査」
の二つから成り立っています。内容は不明ですが2種類あるんですね。
あと経済センサスは、「統計法」(平成19年法律第53号)という法律に基づいた国の重要な統計タスクに位置付けられています。

ちなみにこの”センサス”という聞き慣れない単語ですが、これも統計局のホームページに紹介がありまして、

古代ローマにおいて、市民の登録、財産及び所得の評価、税金の査定などを行う職業をラテン語でCensereといい、これが転じてCensusとなったといわれています。

センサスの語源

昔は国民の納税や労働強制を目的とした国の情報収集目的だったようですが、近代では社会構造の変化をデータで捕捉することで、国の重要施策に活用することを目的としているようです。

経済センサス結果公表データの取得

京都府の飲食業、宿泊業のデータをダウンロードしていきます。ちょっと難解なリンクを辿りましたので、いい機会と思い忘れないうちにダウンロード手順をこの場にまとめておきます。
みなさんも宜しければ一緒にダウンロードしてみてください。

1.経済センサスホームページへアクセス

検索エンジンで”経済センサス”と入力して結果表示すると、上位に表示されるページへ飛ぶことができます。

経済センサス

ここで”経済センサス-基礎調査”をクリックします。

2.経済センサス-基礎調査

そうすると甲調査、乙調査がどうとかの以下のページに来ます。

経済センサスー基礎調査

ここで"調査の結果"をクリックします。虫眼鏡アイコンのボタンですね。

3.経済センサス‐基礎調査 調査の結果

調査結果ページに来ます。なるほど甲調査、乙調査ってそんな違いですね。甲調査結果を探せばよさそうです。

経済センサス‐基礎調査 調査の結果

欲しいのは要約や概要ではなくデータなので、統計表一覧のe-Statへのリンクをクリックすればよさそうです。甲調査結果は令和元年が最新なようですね。"令和元年確報"のe-Statのリンク(ボタンみたいなもの)をクリックします。

甲調査確報のe-Statをクリック

4.経済センサス‐基礎調査(e-Stat)

ここまでお付き合いいただいた方、すいません。実際に確認すると分かるのですが、最新の甲調査結果には都道府県のデータはあるものの、今回希望するデータはこの執筆時点ではなさそうでした。気を取り直して前のページにブラウザバックで戻ります。

5.過去データはないものか

最新年度になくても過去データにはあるパターンではないかと思い、探していると"過去の調査結果"がありました。とりあえず平成26年のリンクをクリックしてみます。

過去の調査結果

6.統計局から探すのは諦め、e-Statから探す方針へ

最初からこの方法を取ればよかったと反省しつつ、探していきます。
データ分析あるあるですが、分析する前のデータ収集はいつも大変です。

e-Statで"経済センサス"で検索
9調査30,500件のデータセット

ざっと全部を見て、経済センサスの活動調査がよさそうです。なぜかリンクが2つありまして、政府統計コード00200553(上の方)をクリックしましょう。上の方は平成28年、下の方は平成24年で新しい方がよいですね。

政府統計コード00200553のページ(ホームページURLをクリック)

7.平成28年経済センサス‐基礎調査

なぜかまた統計局サイトに戻されるので、めげずに調査結果をクリックします。そうするとe-Statに戻れます(笑)

平成28年経済センサス‐活動調査
平成28年経済センサス-活動調査 調査の結果(e-Statをクリック)
平成28年経済センサス‐活動調査

平成28年は2016年なのですが、2018年や2019年のデータもありますね。公開後に更新されたデータだと思われますが、3,374件。かなりの種類がありますね。京都府の飲食業、宿泊業に関連するデータを探していきます。
"最初の事業所に関する集計"の中で、"都道府県別結果(1,823件)"をクリックします。そうすると都道府県リストが展開されますので、"26.京都府[39件]"を探してクリックします。

データセット一覧

ようやくお目当てのデータを探し出せました。あとはダウンロードです。

8.データセットダウンロード

今回は京都府の飲食業と宿泊業の事業環境分析を行いますので、売上や費用の構成を見ていきたいのですが、データセット一覧ページの下部にありましたね。

経理事項等(3のDBをクリック)

ダウンロードはCSVかDBの2択ですが、DBを選択します。ここでCSVをクリックすると、オープンデータにありがちな解説文や注釈がCSVデータの中に含まれてしまい、データ収集でもここまで1時間ほど使って、データ前処理でもゴミデータの削除に付き合うことになるのでDBの選択をおすすめします。

統計表・グラフ表示

先ほど”DB”をクリックするとこの画面に来ることができます。CSVをダウンロードする前にデータ俯瞰が可能です。この機能は便利ですね。
”M宿泊業、飲食サービス業”ありますね。右上のダウンロードボタンをクリックしてください。

表のダウンロード

この画面でいくつかの設定を行います。まず”ヘッダの出力”、”コードの出力”、”凡例の出力”を、”出力しない”に設定します。画面下部に移動して”ダウンロードボタン”をクリックします。

表のダウンロード

4ファイルに分割されてダウンロードすることができます。京都のほか、その他の都市も含まれた国内全データを無事に取得できました。


今回は以上です。

紆余曲折ありましたが、データ分析をするためのデータ収集がいかに大変かご理解いただけましたでしょうか。。地方事業者が今回紹介した手順を追って分析作業をするのは現実的ではありません。実際データ分析が必要な時に手軽にできる環境がないといった問題があると認識しています。

さて次回は、今回ダウンロードしたCSVデータをもとにいよいよ分析に入っていきます。もはや目的を忘れてしまいそうですが京都府の飲食業と宿泊業の収益性分析で新たなインサイトを発掘すること、です。業種比較などから見ていきますが、京都単体では厳しいでしょうから、日本の主要な観光都市との比較なども検討してみたいと考えています。

ではまた次の機会に!


(おまけ)地方事業者向け気になるニュース紹介

今回も私が個人的に気になるニュースをピックアップしています。
地方事業者の目線で役に立つ情報を中心にご紹介です。

抽出期間:2022/3/27~2022/4/9
ニュース転載元:EnterpriseZine(エンタープライズジン)

3年以内に1,500名以上のDX人材を育成へ 電通国際情報サービスがUiPathと協業事業

企業のDX(デジタルトランスフォーメーション)を担う人材が不足している問題を解決するため、大手やITベンチャーを中心に人材育成事業が盛んに人材育成事業に参入しています。地方にはそもそも人材がいないという問題があるのですが、私の身近なところで首都圏のIT企業では副業解禁や早期退職して地方移住する流れが出来つつありますので、DXを含めた人材不足問題の解消を狙えるポテンシャルがあると考えています。

NTTテクノクロス、機械設備の異常音をAI検知で “長年の経験と勘に頼らない”製品を販売

これも仕事柄思うところがある記事です。人間の経験やノウハウを機械化するためにAIを活用したプロジェクトを行いますが、経験則上は75%以上の精度で経験と勘はデジタルに再現できると思います。記事のように異常検知の場合は75%精度では使い物にならないでしょうが、営業やマーケティングなどのビジネス活動で75%精度なら許容できる範囲ですよね。

化学プラントをAIで運転支援 NTT Comと横河ソリューションサービスが協同提供を開始

こちらはAIを再現性観点ではなく、新たな気づきを得る観点で活用しているケースになります。人間の経験と勘といってもキャパシティに限界がありますが、機械に任せると人間の想像力をも超える膨大な計算を行いますので、その中から思いもしない結果が得られるものです。飲食業や宿泊業も顧客データや販売履歴などのほか、サービス提供過程の業務プロセスデータを可視化できればAIを活用してお客様サービス向上の気づきや、作業効率化の気づきなど新たな発見がいろいろと検証できるんじゃないかと思っています。


この記事が気に入ったらサポートをしてみませんか?