メモ:スクレイピングネタ
定量的な分析がすきな私。以下メモ。
(最近、noteをツイッター代わりにしているので)
よく読まれる記事の特徴を知るため、note記事をスクレイピングして、
文章量、文章の構成、頻出単語等をAIに分析させる
予約率の自動追跡
口コミ・日記・紹介文からの自動プロファイリング
自動プロファイリング結果と、実際の予約率との相関
以下、仮説
人間って、自分の知っている単語しか書けない
語彙力の量は、知識量と比例する
日記の語彙力をみれば、知識量を定量化できるかも
(まれに、知識は多くても出力が苦手な人もいるから、それは例外として)
少なくとも「語彙力大→知識量大」は真だろう
あまり一般的に用いられないインパクトのある単語は、その人の言いたいことが最も現れている
多数の人が書いた口コミをテキストマイニングし、インパクトのある単語が
多数の人で用いられたらその人の特徴をあらわしているはず
やりたいことは、アマゾンのサクラチェッカーみたいなもの
memo2
この記事が気に入ったらサポートをしてみませんか?