見出し画像

山口県が全国1位となった客室稼働率 データアナリストへの道#23

デジテック for YAMAGUCHI 運営事務局 兼 Y-BASEスタッフのハラマルです。

今から御紹介するデータ分析に非常にてこずってしまい(笑)、久しぶりの投稿となってしまいましたが、この間、レノファ山口の新監督が決定、就任し、大変面白いことになっています!
「超攻撃型」という前評判通りの戦い方で快勝を収めたと思ったら、相性の悪い相手からも堅実に勝ち点を獲ったりと、目が離せません。
レノファの選手が敵陣に押し込む、噂の「ハイライン」は、中々映像では確認できないので、是非、現地で観戦してみてください!中継映像に映っていない範囲も(むしろそっちが?)楽しいですよ!

今回のテーマは客室稼働率

さて、先日、「山口県の宿泊施設の客室稼働率が全国一位だった」という報道を目にしました。
報道では、「山口県にはコンビナートが複数あり、コロナ禍が落ち着いて、海外からの技能実習生が増えたことも含め、ビジネス客が多かったのではないか」や、「工場の定期点検などで訪れる県外客など、コロナ禍による影響が少なかったのではないか」といった分析が紹介されていました。

今回も、この報道で採り上げられていた元データを入手して、自分なりの分析をしてみたいと思います。

元データとデータ加工

まず、元データと思われるものはこちらにありました。

たくさん集計結果があるので、どれのことか探し回ってしまいましたが、「令和4年年間値(速報値)」というタイトルのようです。報道発表資料を見ると、「令和5年2月28日」とあるので、リリースされたのは何ヵ月も前のことだったんですね。
確かに、山口県が全国トップで赤字になっています!

https://www.mlit.go.jp/kankocho/siryou/toukei/content/001588924.pdf


よく見てみると、3月に「正誤表」というものが出されていますが、修正後のデータが公開されていないため、今回は2月にリリースされたデータをそのまま使うことにします。(すみません、正誤表が36枚もあるので、箇所を特定して手作業で直していく手間を惜しみました。)

さてさて、この元データのExcelですが、なんとシートが272もあります!
帳票間の関係性を確認しつつ、どのシートのデータが、今回の報道の元になったものなのか、他にも使えそうなデータがあるのか、ないのか、時間をかけてチェックします。

この辺かな、とアタリを付けたら、過去にどこまで遡ってデータを収集できるのか、それと、一番肝心なのは、どういう形でそれらのデータを統合していくべきか、検討も必要です。
ここで失敗すると、データの切り貼り作業で苦労することになりますので・・・。

一通り目途がついたのですが、一番重要な「客室稼働率」については、元データが足りないことに気が付きました。
「用語の解説」を読むと、「客室稼働率= 利用客室数 / 客室数*各月の日数」で算出されるようなのですが、「客室数」のデータが見当たりません。客室稼働率と利用客室数から算出しようかと思いましたが、各月の日数が変動するので算出が大変そうです。仕方ないので、これは、自分での算出は諦め、算出された結果をそのまま採用することにします。

データで困ったのが、外国人宿泊者数の国別内訳に、「*」が入った数字があったりなかったりした点です。「統計表を利用する上での注意」というものを見てみると、これは「標準誤差率が 30%以上の推定値に*印を付している」とのことです。
が、これ、データとして「*」が入っているので、当然、数値として認識してくれません。「*」の文字を置換で消去しようとしましたが、うまくいきません。仕方ないので、「=IF(ISNUMBER(FIND("",該当セル)),SUBSTITUTE(該当セル,"",""),該当セル)」という関数で「*」を除去し、その値をさらにValue関数で数値変換しました。
これ、次はもうできないかも。

さらに、データを統合後、不要な行列の削除や、並び替えなど、すごく地道な作業をたくさんしました。聞いても面白くないと思いますので説明は省略します。
そして、ようやくTableauにデータ投入するところまで来ましたよ。

客室稼働率

はい、それでは、まず、客室稼働率を都道府県別に見てみましょう!

客室稼働率(都道府県別) ※山口県は赤色

報道にあった2022年(令和4年)は、2月~5月の間、全国トップとなっています。その後もかなり上位をキープしていますね。これで、年平均でトップになったようです。
過去から見てみると、2018~2019年と全国中位でしたが、2020年の4~5月頃に全国一斉に大きく落ち込んでいる辺りから、全国上位になっているようです。
また、2023年の1~2月には、残念ながら全国中位に戻っているようです。

2020年4月頃から2022年12月頃までの間、山口県が全国の中位から上位に上がり、元に戻ったということから、紹介されていた分析の通り、コロナ禍期間中の要因が大きく関わっていることが読み取れます!

次に、業態別での特徴があるか見てみます。
ダッシュボード機能を活用して2つのグラフを並べてみました。上段が全国平均、下段が山口県にして、見て比較できるようにしています。

業態別の客室稼働率

大きな動きを見てみると、コロナ前の2018~2019年は、全国は8月に客室稼働率が上がる時期がありますが、山口県では3月頃にも山があるようですね。特に赤色の「リゾートホテル」で伸びている傾向があります。
GWがある5月にも山がありますが、2018年と2019年では伸び方に差があるようですね。調べてみると、2018年のGWは、3連休+平日2日+4連休で、間の2日間を休んで最大9連休という企業が多かったようです。2019年は、天皇即位に関する休日があり10連休となった年でした。この違いが客室稼働率に影響しているようです。

2020年になると、コロナ禍で一気に客室稼働率が下がりますが、山口県は全国平均と比べると、ビジネスホテル(オレンジ)の落ち込みが少ないようです。上グラフの全国では、2018~2019年に60%~80%程度だったビジネスホテル(オレンジ)は、2020年3月頃に急落し、その後は40~50%程度までしか回復していません。2022年終わりごろに、ようやく60%程度になっています。
一方、下グラフの山口県では、コロナ禍前に60~80%で、30%まで急落するも、2020年10月に大きく回復し、その後50%~70%で推移しているようです。この辺りが、冒頭に紹介したビジネス客が安定していたという評価になったものと考えられます。

が、よくよく見てみると、リゾートホテル(赤)も全国より高い数値で推移しているようです。
全国では、50%まで回復したのは2022年8月、11月ですが、山口県では、2021年の8月、10~12月、2022年の5月、8月、10~12月となっています。

あれ、ビジネスホテルだけでなく、リゾートホテルの稼働率の高さも影響していませんか?もうちょっと分析してみましょう。

客室数

さて、ここで、一つ確認しておかないといけないことがあります。
先ほどから「客室稼働率」を取り扱っていますが、これって割合なので、分母の影響がある可能性もあります。その辺りをはっきりさせておきましょう。

客室稼働率の分母は、先述のとおり「客室数×稼働日数」になるのですが、このデータがないため、ここでは便宜的に、帳票にあった「施設数」を見てみようと思います。
施設数がほぼ同じならば、客室数も大きく変動していないだろうということです。

施設数(都道府県別) ※山口県は赤色

え、山口県、めっちゃ少ない!
というのが第一印象ですが、施設数に大きな増減はないようです。
このため、客室数の増減が客室稼働率に影響している可能性は少なさそうです。重要なのは、分子の「利用客室数」ということになりそうです。

ということで、大方の予想通り、宿泊者数が増えた→利用客室数が増えた→客室稼働率が上がったという風に単純に考えてよいかと思います。

宿泊者数

それでは、宿泊者数の推移を見てみましょう。

宿泊者数(都道府県別) ※山口県は赤色

ちょっと東京都が突出し過ぎていて、地方が下の方にゴチャっと集まっているため、一見しただけでは分かりづらいですね。
試しに、外国人宿泊者数と並べて見てみましょうか。

宿泊者数(都道府県別) ※山口県は赤色

上段が先ほどのグラフで、下段に外国人宿泊者数を並べてみました。
スケールを同じにすると、外国人宿泊者数の増減は、全体に対する影響はわずかそうですね。
あれ?冒頭に「海外からの技能実習生が増えた」っていう分析を紹介しましたが、これが山口県の客室稼働率を上位に引き上げた要因には思えませんね・・・。ちょっと違うんじゃないかな?

次に、業態別の宿泊者数を、上段に全国、下段に山口県で並べてみました。それぞれに、日本人宿泊者数と外国人宿泊者数を並べてみます。

業態別の宿泊者数

これを見ると、山口県における日本人の宿泊者数で、ビジネスホテル(オレンジ)が、2020年9~10月頃、2022年3~5月頃に大きく伸びているのが特徴的です。特に、この時期は、コロナ前より多くなっているではないですか!やっぱり、ここが原因のような気がします!

客室稼働率で見たとき、赤色のリゾートホテルの伸びも目立っていましたが、宿泊者数で見た場合は、ビジネスホテルよりも目立った増減はないようです。
つまり、リゾートホテルの方は、分母(客室数)が少ないので、宿泊者数の少しの増減で、稼働率が大きく増減していたのではないかと推察されます。

以上のことから、山口県全体の宿泊稼働率に大きく影響を及ぼしているのは、ビジネスホテルを利用している日本人の数だとアタリをつけることができました。

ちなみに、外国人宿泊者数は、日本人と比較すると増減が全然わからないくらいになっていましたので、改めて整理してみると以下のようになりました。

外国人宿泊者の国別内訳

2018~2019年は、全国では中国から、山口県では韓国からの宿泊が一番多かったようですが、2020年に一気に落ち込み、今年の2月時点ではまだまだ回復の途中といった状況でした。

原因の追究

それでは、山口県にフォーカスして分析を続けてみたいと思います。
まずは、山口県のビジネスホテルに宿泊されている方が、県内・県外のどちらかからのお客さんだったかの分析です。

山口県のビジネスホテルの宿泊者数

県内(オレンジ)からの宿泊数は一定の水準で推移しているようです。先ほど目を付けた、2020年10月、2022年春に大きく伸びているのは、県外からのお客さんのようです。

次に、その宿泊施設が、「観光目的の宿泊者数が50%以上か未満か」という属性があったので、こちらも見てみます。(ただし、こちらはビジネスホテルに限ったものではありません。)

山口県の利用客室数(観光目的の宿泊者割合別)

これを見ると、「観光目的の宿泊者数が50%未満」の宿泊施設において、2020年10月、2022年春に大きく増えています
これだ!と思いましたが、宿泊者個人に、利用目的が観光かビジネスかを尋ねている訳ではないようなので、これだけでビジネス目的と決めつける訳にはいかないかもですね。

さらに、従業員規模別の利用客室数というデータもありました。

山口県の利用客室数(従業員規模別)

従業員規模が10-29人と30-99人の規模の宿泊施設において、同じように2020年10月、2022年春に増加が認められます。2022年は従業員規模0-9人の施設でも増加しているようですね。

以上のことから、山口県においては、ビジネス客が多く利用するビジネスホテル(小~中規模)に、県外から多くの宿泊者が来られたことが、宿泊稼働率を全国1位までに引き上げたものと考えられます。

冒頭に紹介した「工場の定期点検などで訪れる県外客など、コロナ禍による影響が少なかった」という分析は、こうした状況を踏まえた推察だったのかもしれませんね。

V-RESASとの比較

さて、これまで、従前と同様に元データをTableauを使って分析してきたのですが、今回は、コロナ禍の影響が予想されていることもあって、新たな試みとして「V-RESAS」の分析も使ってみようと思います。

「V-RESAS」は、国が提供しているサイトで、「新型コロナウイルス感染症が地域経済に与える影響を適時適切に把握することで、観光関連施設や生活基盤等の地域資源を維持し、感染症拡大の収束後に地域経済を再活性化させていくための施策の立案、遂行及び改善をするためにお使いいただけます」とあります。今回にピッタリではありませんか?

早速、宿泊に関連しそうなデータを見てみましょう。
利用ルールに基づいて、ダウンロードした画像をそのまま貼り付けますね。

V-RESASからダウンロードした画像

まず、山口県内の宿泊者数です。グラフの作りが2019年同月比となっています。さっきのTableau分析と同じように、2020年10月前後と、2022年春頃に山があります。

が、よく見ると、2020年秋は「子ども連れ」(=家族)が多く、2022年の山は「一人」が多いようです。このデータは先ほどの「宿泊旅行統計調査」にはなかったものです。もしかして、2つの山が生じた理由は、違うのかもしれません。

次に、「宿泊予約時の予約代表者の居住地が県内か県外か」で見てみると、子ども連れの場合は、県内からの宿泊が多いようです。

V-RESASからダウンロードした画像

一人の場合も・・・、あれ、県内の方が多いようですね。
先ほどのTableu分析から、てっきり、「一人」=「県外からのビジネス客」と思い込んでしまいましたが、そうではないのかもしれません。

V-RESASからダウンロードした画像

いや~、これはどっちなんでしょうか!?県外からの方が多ければ、Tableau分析と一致するので、おしっ!となるところですが…。

気になるのは、このデータは「予約代表者の居住地」ということになっています。ということは、県内の方が予約していても、県外から宿泊に来るっていうことがあるのでしょうか?
例えば、工場の定期点検で来てもらうとして、「宿泊の予約は県内の点検を受ける企業が取って、点検には県外から点検業者の方が宿泊に来る」、という構図があれば、両方のデータに整合があるように思いますが・・・。そんな実態があるものかどうか、全然想像がつきません!

県内客が増えたのか、県外客が増えたのか、よく分からなくなったので、違うデータでも見てみましょう。
「V-RESAS」には、旅行者がどの県から来たかというダッシュボードもありました。「2019年の月平均の宿泊者数との比率(指数)」だそうです。それがこちらです。

V-RESASからダウンロードした画像

山口県への旅行者がどこから来たかについて、2020年11月では、一番大きい構成比は山口県で19%、次いで広島県12%、福岡県と大阪府が11%でした。
2022年5月では、一番大きい構成比は山口県で49%、福岡県8%、広島県6%となっていました。
こちらも県内客の増加が目立ちますね。

さて、県内客が増えたのか、県外客が増えたのか?
データの取り方や精度、出典が違い、それぞれの詳細を把握していないので明確には分かりませんが、これまでの状況を踏まえ、自分なりの解釈は次のとおりです。

最初にTableauで分析した宿泊旅行統計の数字(以下にグラフを再掲)は、宿泊者数という絶対値なので、精度は分かりませんが、傾向としてはこの動きがおそらく正しいのではないでしょうか。つまり、県外客が増加したものと考えます。
一方、V-RESASの方は、コロナの影響を分析するという目的から、「2019年の月平均の宿泊者数との比率(指数)」で表されています。年間でも月によっては増減がある宿泊者数を、月平均にしてしまっているため、宿泊者数が増える月は特に大きく跳ね上がったように見えるのではないでしょうか。また、月毎の波が激しい県外客は、指数化することで分かりづらくなっているのではないでしょうか。
ということで、V-RESASで見ると県内客の増加が目立ちますが、それは基準としている値とそことの比較の問題であって、山口県の宿泊稼働率に大きく影響を与えているのは県外客の増加だと考えます。

宿泊旅行統計の数字(再掲)

結論

さて、今回は、宿泊旅行統計の膨大なシートにまたがるデータを、整理してTableau分析してみる、それをV-RESASと比較して考えてみるという試みをしてみました。

その結論としては、

①山口県では、コロナ禍で全国的に大きく宿泊稼働率が下がった中、2020年10月頃に県内の子ども連れ家族がビジネスホテルを多く利用し、宿泊稼働率が改善した。

②それまで全国中位だった宿泊稼働率は、県内外からのビジネスホテル利用者が一定数いることで、全国上位となった。

2022年春には、県外からのビジネス客の増加が全国よりも早く始まり、2022年の年間で宿泊稼働率が全国1位となった。

④2023年になると、全国でも宿泊稼働率の改善が進み、山口県は全国中位くらいに戻った

といったことが分かったのではないかと思います。

また、⑤宿泊施設数が全国の中でも少なく、リゾートホテルも高い客室稼働率になることがあることから、もっと山口県に宿泊施設があっても良い(利用される)可能性があるのでは?
なんてことも思いました。

いや~、データ整形にも苦労しましたが、分析や記事を書くのにも苦労しました・・・。
7,000字オーバーの長文になりましたが、少しでも楽しんでいただければ幸いです。