見出し画像

ワードクラウドで自分の書き癖を見てみる

 この記事は、以下の記事を拝見して書かせていただきました。

 記事などを読んでいるとたまに様々な単語が羅列されている塊を見ることがある。単語ごとに大きさや色が異なる。直感的に重要な単語ほど大きく、中央に寄せて書いてあるのだろうなと思っていたが、noteで上に引用した記事を拝読してどんなものか分かった。
 名前はワードクラウド。文章を形態素解析して出現頻度や等級付をしておしゃれに配置する。

 、ということは自分が今まで書いたnoteの記事をまとめて全部ワードクラウド化すれば自分がついつい多用している単語がわかるのでは?というのが仮説です。ちなみに予想では圧倒的に「思う」と言う単語を多用していると思っていました。

 早速今まで投稿した記事訳20本、合計1万字弱を以下のサイトに投入。

その結果が以下のとおりです。

出現頻度順のワードクラウド


スコア順のワードクラウド

 案の定「思う」は出現頻度が高かったようです。同サイトの解説によると

単語出現頻度

文章中に出現する単語の頻出度を表にしています。単語ごとに表示されている「スコア」の大きさは、 与えられた文書の中でその単語がどれだけ特徴的であるかを表しています。 通常はその単語の出現回数が多いほどスコアが高くなりますが、 「言う」や「思う」など、どの文書にもよく現れる単語についてはスコアが低めになります。

https://textmining.userlocal.jp/results/4sRfwk9quKPziKWJRB9ystR4ijxuHtzw

とのことなので、「思う」を多用しているのはある意味一般的な傾向ではあるようです。スコア順のワードクラウドで出現した「Creator」は私がよく使う画像生成AIの「Bing Image Creator」でしょう。

 最近はAIで文章の要約などをおこなうことも多いですが、単語の視点から文章を見直すのにはいいかもしれませんね。個人的には「”思う”が文に多い」と言う注意を大学の恩師から受けていたことを思い出しました。反省していた学生の頃が懐かしいのと、当時からあまり変わっていないのだなと改めて感じた日でした。

この記事が参加している募集

気に入っていただけたらサポートお願いします。いただいたサポートは子供のオムツ代にさせていただきます。