見出し画像

メモ:スクレイピングネタ

定量的な分析がすきな私。以下メモ。
(最近、noteをツイッター代わりにしているので)

よく読まれる記事の特徴を知るため、note記事をスクレイピングして、
文章量、文章の構成、頻出単語等をAIに分析させる

予約率の自動追跡

口コミ・日記・紹介文からの自動プロファイリング

自動プロファイリング結果と、実際の予約率との相関


以下、仮説

人間って、自分の知っている単語しか書けない
語彙力の量は、知識量と比例する

日記の語彙力をみれば、知識量を定量化できるかも
(まれに、知識は多くても出力が苦手な人もいるから、それは例外として)
少なくとも「語彙力大→知識量大」は真だろう

あまり一般的に用いられないインパクトのある単語は、その人の言いたいことが最も現れている
多数の人が書いた口コミをテキストマイニングし、インパクトのある単語が
多数の人で用いられたらその人の特徴をあらわしているはず


やりたいことは、アマゾンのサクラチェッカーみたいなもの


memo2



この記事が気に入ったらサポートをしてみませんか?