shoge

データ分析が趣味です。プログラミングもできます。ですが仕事はマーケティングをやってます…

shoge

データ分析が趣味です。プログラミングもできます。ですが仕事はマーケティングをやってます。 様々なデータを収集して分析して見えてきた情報を記事にしていこうと思います。また、時には分析で分かったことを自分で実証していこうと思います。 よろしくお願いいたします。

マガジン

  • デリヘルタウン分析まとめ

    デリヘルタウンの情報を元に風俗嬢やお店の分析記事。 また、デリヘルタウンから情報収集するプログラミングの共有。

最近の記事

【ジム】東急スポーツオアシスの値上げ

しょげと申します。普段はネット上の情報を収集してデータ分析を行い、そこから分かった情報などを記事にしています。今回はいつも趣向を変えましてとある出来事の私の妄想を書いていきたいと思います。 この度、東急スポーツオアシスが新型コロナウイルスによる入会数減少&退会者増大に伴い月額料金の値上げを発表しました。2021年5月から値上げということで会員の方にはメールと郵送により通知されました。 知らない方も多いと思いますので説明しますと、東急スポーツオアシスは会員制フィットネスクラ

    • ぴゅあらばのレビューは信用できる?

      こんにちは。データ分析が趣味のしょげといいます。 インターネット上にあるデータ情報を収集分析して、分かったことを記事にしています。今回は、ぴゅあらばのレビューについて分析してみました。 目的ぴゅあらばのレビューがどの程度信用できるかを検証する。 ぴゅあらばとは?公式サイトでは以下の説明がされています。 ぴゅあらばは、全国の風俗情報とデリヘル情報を地域別、業種別、女の子別で簡単に検索することができます。また、ユーザーからの口コミやランキング、風俗体験動画やグラビアなど様々

      • 【シティヘブン】正直な風俗店の実検証

        こんにちは。データ分析が趣味のしょげと申します。普段は、インターネット上の情報を収集分析して分かったことを記事として挙げています。 以前の記事にて、シティヘブンのレビュー情報から正直な風俗店を紹介する記事を上げさせていただきました。今回は、この紹介したお店のうちNo.2のデリス新宿店さんを実際に数回利用してみて、本当に正直なお店だったのかを検証してみました。 調査目的デリス新宿店さんが正直なお店であるか否かを確認します。ここでいう正直なお店とは、以下の3つの基準で判断しま

        • 【Python】シティヘブンのレビュー情報をデータベース化~第3章~

          こんにちは。データ分析が趣味のしょげといいます。 本記事ではシティヘブンのレビュー情報を取得しデータベース作成するプログラムについて解説していきます。初めてこの記事をご覧いただいた方は以下の記事から読まれることをお勧めいたします。 プログラムの全体構成①都道府県別のレビューTOPページURLを取得 ②すべてのレビュー一覧ページURLを取得 ③すべてのレビュー詳細ページのURLを取得 ④すべてのレビュー詳細ページをHTMLで保存 ⑤取得したHTMLデータからレビュー情報を抽出

        【ジム】東急スポーツオアシスの値上げ

        • ぴゅあらばのレビューは信用できる?

        • 【シティヘブン】正直な風俗店の実検証

        • 【Python】シティヘブンのレビュー情報をデータベース化~第3章~

        マガジン

        • デリヘルタウン分析まとめ
          0本

        記事

          【Python】シティヘブンのレビュー情報をデータベース化~第2章~

          こんにちは。データ分析が趣味のしょげといいます。 本記事ではシティヘブンのレビュー情報を取得しデータベース作成するプログラムについて解説していきます。初めてこの記事をご覧いただいた方は以下の記事から読まれることをお勧めいたします。 プログラムの全体構成①都道府県別のレビューTOPページURLを取得 ②すべてのレビューページURLを取得 ③すべてのレビュー詳細ページのURLを取得 ④すべてのレビュー一覧ページをHTMLで保存 ⑤取得したHTMLデータからレビュー情報を抽出しC

          【Python】シティヘブンのレビュー情報をデータベース化~第2章~

          【Python】シティヘブンのレビュー情報をデータベース化~第1章~

          こんにちは。データ分析が趣味のしょげといいます。 本記事ではシティヘブンのレビュー情報を取得しデータベース作成するプログラムについて解説していきます。初めてこの記事をご覧いただいた方は以下の記事から読まれることをお勧めいたします。 プログラムの全体構成①都道府県別のレビューTOPページURLを取得 ②すべてのレビューページURLを取得 ③すべてのレビュー詳細ページのURLを取得 ④すべてのレビュー一覧ページをHTMLで保存 ⑤取得したHTMLデータからレビュー情報を抽出しC

          【Python】シティヘブンのレビュー情報をデータベース化~第1章~

          【Python】シティヘブンのレビュー情報をデータベース化~序章~

          こんにちは、データ分析をしているしょげといいます。 本記事からシティヘブンのレビュー情報を取得してデータベースを作成するPythonプログラムを紹介していきます。この記事では、概要として完成イメージ図とプログラムの全体設計?をご紹介し、次の記事からソースコードを交えて説明していきます。 なお、ここで作成したデータベースを用いてシティヘブンのレビュー情報を分析した内容は別記事で紹介しています。興味のある方はご覧ください。 完成図今回作成するものはデータベースですが、Bigqu

          【Python】シティヘブンのレビュー情報をデータベース化~序章~

          【シティヘブン】低評価レビューが無い風俗店は激安店?

          こんにちは、データ分析が趣味のしょげといいます。 今回もシティヘブンのレビュー情報を元に分析してまいります。 これまであげた以下2つの記事の続きになりますので、先に以下2つの記事を読まれることをお勧めいたします。 この2つの記事をざっくりと説明します。「シティヘブンのレビューは信用できる・」の記事では、分析により ①シティヘブンのレビューは高評価レビューしか掲載しないお店が多く、そのまま信用できる情報ではない。 ②お店からの返信有無はお店の優良店であるかの判定材料にならない

          【シティヘブン】低評価レビューが無い風俗店は激安店?

          【高速化】Pythonで風俗嬢のデータベース作成

          前回の記事では、Pythonでデリヘルタウンのスプレイピングを行い、デリヘル嬢のデータベースを作成するプログラムをご紹介しました。これで約35万人のデリヘル嬢のデータが手に入り、このプログラムを応用していくことで風俗に関する分析がさらに進んでいけるのですが、ここで一つ大きな問題に直面しました。 それは処理速度です。 実施してみるとわかりますが、風俗嬢のデータベース作成までに多くの時間がかかります。以下の①~④の実施工程がありますが、すべて実施すると半日以上かかります。。

          【高速化】Pythonで風俗嬢のデータベース作成

          デリヘル店舗別 平均低身長ランキング

          以前の記事でデリヘルタウン掲載データのうち、身長は一般女性データと近く、比較的信頼できることを確認しました。今回は、店舗別の平均身長を求めてランキング付けしてみました。低身長な女の子が好きな方はこのお店の中で好みの子を選べば満足する可能性が高いと思います。  今回、お店の女の子の人数が10人以上在籍しているお店に限定して算出しています。また、noteの規約により風俗店のリンクを掲載することができません。そのため、興味のある方はご自身で検索をお願いいたします。 No.1 1

          デリヘル店舗別 平均低身長ランキング

          全国で最も身長が高いデリヘル嬢は誰?

          こちらの記事で紹介したプログラムを用いて全国のデリヘル嬢のデータベースを作成しました。その数約35万人分です。 まずはこのデータベースの身長をヒストグラムで出してみました。単峰性のヒストグラムであり、このデータが正規分布(ガウス分布)に従いそうです。そのあたりの分析は別記事でご紹介いたします。今回は、その中でも上位3位の長身デリヘル嬢をご紹介します。 平均身長 158cm 最大身長 188cm 最小身長 126cm 全国No.1 身長が高い子名前:れおさん  お店:Hi

          全国で最も身長が高いデリヘル嬢は誰?

          【Python】風俗嬢のデータベース作成

          今回、風俗分析に使用しているデータベースの作成プログラムについてご紹介します。データベースといってもBigquery等で運用する大規模なものではなく、CSVファイルへ出力する以下のものになります。 取得元はデリヘルタウン。こちらに掲載されている女の子情報をPythonのスクレイピングによりデータ収集し、CSVファイルとして出力しています。PythonのソースコードはぽちゃPRESSさんのものをベースに、少しだけ手を加えたものです。以下の部分が変わっています。 ・ログ出力機能

          【Python】風俗嬢のデータベース作成

          +5

          【写真】歌舞伎町のラブホ通り

          【写真】歌舞伎町のラブホ通り

          +5

          【関東】正直な風俗店を紹介

          前の記事でシティヘブンのレビューは高評価に大きく偏っており、レビューをそのまま信用することができないことを確認しました。ただその中でも低評価を掲載しているお店は存在しているため、レビューの平均点が高く低評価も掲載しているお店が正直者で優良店ではないか、と仮説を立てました。 そこで、今回は前回立てた仮説を検証していきたいと思います。 以下に低評価(3.0未満)を掲載しているお店TOP3をご紹介いたします。 第1位:H-ashアッシュ(新宿・歌舞伎町)◆レビュースコア 平均 

          【関東】正直な風俗店を紹介

          都道府県別 デリヘル嬢の割合は?

          北海道のすすきの、東京の吉原や歌舞伎町、岐阜の金津園など全国各地に展開する日本の性風俗業界。各地で文化も異なり、独自システムがあったりととても個性的です。この各地の風俗文化や特徴について調べていきたいと思います。 今回は第一弾として、全国のデリヘル嬢の割合について調査してみました。 デリヘル嬢のデータは、デリヘルタウンに掲載されている嬢のデータを使用しています。都道府県別の女性人口と比較して、デリヘル嬢の割合が多い都道府県順に並べてみました。TOP10を抜粋したものが結果が

          都道府県別 デリヘル嬢の割合は?

          シティヘブンのレビューは信用できる?

          シティヘブンのレビューへの疑問風俗情報サイトの中で一番大きなサイトと思われるシティヘブン。このサイトにレビュー情報があるのは、風俗を利用したことがある方ならご存じの方も多いと思います。ただ以下の疑問を持ったことはないでしょうか。 「このレビュー情報、どこまで信用して良いの?」 シティヘブンにレビューを書いた事がある方はご存じかと思いますが、レビューされたものは必ずシティヘブンに掲載されるわけでなく、シティヘブンとお店の双方の了承を得て掲載されます。つまり、レビューを掲載す

          シティヘブンのレビューは信用できる?