見出し画像

【Pythonでスクレイピング】デートに使える「ええ店」探し_東京編🍷

女の子とのデートの時、ディナー誘っときながら、割り勘なんてダサいことできやしまへん。

せやけど、アホみたいに、バンバン金使ってたら干上がってまう。

ほんならいっちょ、女の子とのデートに使える「ちょうどええ店」をデータ分析して、探してみたろやないか、と。

そう、思ったわけですわ。

こんな感じの内容ですわ

①食べログで、東京にある利用シーン「デート」のお店をスクレイピング
②星数とか、値段とかの視点で分析して「ちょうどええ感じの店」を探す
③大阪編、福岡編もあるで

スクレイピングで店リストを作成

食べログさんを使わせてもらいます。
いつもほんまお世話になってます。おおきにです。

エリアを「東京」、利用シーンを「デート」にしたら、3,852件(19/06/11時点)出てきたわ。さすが東京、ごっつ多いで。

画像1

まずは、店のリスト作るで。
スクレイピングをバチコン!かまして、こんなデータ用意したわ。

画像2

ランキングで上から1,195の各店の以下のデータを取得したわけや。

①店舗名
②星の数
③ディナーの値段
④レビューの数

画像3

※やり方はコチラ

※スクレイピングはマナーと節度守ってやらな、お母ちゃんに怒られるで。

よっしゃ、ここから「ええ店」探しや。

一言に「ええ店」言うても定義が難しいけど、「評価星の数)は高いけど、値段はリーズナブル」な店がええわな。

よっしゃ、探すで。

【横軸】星の数×【縦軸】ディナーの値段のプロット図

画像4

縦軸がディナーの値段で、横軸が星の数で、各店舗をプロット。

右下にいくほど「ちょうどええ店」になるわけや。
※ディナーの値段は下限と上限の間の金額でプロット

画像5

ほとんど値段10,000円以下×星3.9以下に入るな。

このままでもええけど、ちょっともう一手間加えて、わかりやすくするで。

3つのグループに分けてみる

各店舗のレビュー(コメント)の数を元に、以下のグループにしてみたで。※平均のレビュー数は95件

画像6

A:「レビュー数」が平均以上の店舗
レビュー数が95件以上
みんなから評価されてる。安パイのお店や。人気で予約取りづらいかも?

B:「レビュー数」が平均以下の店舗
レビュー数が95件未満
Aよりは不安やけど、ええ店として捉えても良さそうや。

C:Bの中でも「レビュー数が30件以下」の店舗
レビューはまだ少ないながらも高評価、隠れた名店かも!?!

で、再度プロット。

A:「レビュー数」が平均以上の店舗

画像7

6,000円以下で食べられるお店は、残念ながら無しや!みんなに人気のお店や、そんな甘ないゆうことやな!!

せやけど、「ちょうどええ店」がありそうやで。

画像8

ここや。

画像9


次は、このグループでみてみるで。

B:「レビュー数」が平均以下の店舗

画像10

おっ!5,000円辺りで食べられて、星3.9以上もある!これはええ店や。

画像11

画像12


最後に、レビュー数はまだ少ないけど、隠れた名店かもしれないグループをみてみるで。

C:Bの中でも「レビュー数が30件以下」の店舗

画像13

・レビュー数はまだ多くないけど、リーズナブルで評価が高い隠れた「ええ店」かもしれへんで!!

画像14

画像15

「ちょうどええ店」一覧(東京編)

ってことで、今回のデータ分析でわかった「ちょうどええ店」や!!
狙ってる好きなおねえちゃん誘って、確かめてみてくれや!

A:「レビュー数」が平均以上の店舗

レビュー数が95件以上。みんなから評価されて、安パイのお店や。人気で予約取りづらいかも?


B:「レビュー数」が平均以下の店舗
レビュー数が95件未満。Aよりは不安やけど、ええ店として捉えても良さそうや。

C:Bの中でも「レビュー数が30件以下」の店舗

レビューはまだ少ないながらも高評価、隠れた名店かも!?!

とまぁ、わざわざこんなデータ分析しなくても、食べログで直接、値段と星でフィルタリングしたらええだけの話やねんけども、、、。

大阪編、福岡編もあるで

やり方(スクレイピング→データ分析)


貴重なお時間で読んでいただいてありがとうございます。 感謝の気持ちで、いっPython💕