見出し画像

6.ChatGPTに関する人気Top100の記事タイトルを分析してみた:noteAPI×市場調査


はじめに

前回の記事で、ChatGPTではなくPythonに手を出してみたらnoteの市場調査が進みそうなことを書きました。

実際、Pythonを動かしてみて、noteAPIからデータをDLできることが分かったので、note検索結果を100件試しに抽出して無料記事を書くことにしました。

ChatGPTの使い方もまだまだ模索中の為、ChatGPTにも分析を手伝ってもらおうと思います。
なお、こちらは2024/2/4に取得したデータを基に記載された記事ですので、時間が経つにつれ状況が変わることになります。その旨ご了承の上、お読みください。


ChatGPTに関する人気Top100の記事タイトルの傾向


さて、noteのトップの上部にある検索画面にChatGPTの文字を打ち込み、Enterを押して検索をかけます。

検索結果は約10,000件。
100件なので1%の記事のタイトルを見てみようという企画です。
さすがにタイトルだけだとこの後の記事が書きにくいので、ユーザーIDも抜き出して検討します。

なお、抽出されたデータなのですが、 人気のある記事が抽出されている。ように見えるものの、ブラウザに表示される検索結果と完全には一致しない結果となりました。

なので、たぶん人気記事Top100というネーミングで話を続けます。

ユーザーID別にみると、一人だけものすごく掲載されている方がいる

まず、たぶん人気記事Top100をクリエイター別にみて見ます。
(以降、敬称略)

  1. 西田親生@ICTdoctor・総合コンサルタント :17記事

  2. ショウ【AI副業マニア】:5記事

  3. 山口周:4記事

  4. fuzz(ふぁず):4記事

  5. AIと創る健康データベース:4記事

他、3記事が3名、2記事6名、1記事45名 という結果でした。
なお、ChatGPTについてなおりんも記事を書いておりますが、残念ながらたぶん人気記事Top100には入っておりませんでした! 残念。

なおりんのことは脇に置いて起き、 17記事も たぶん人気記事Top100 に掲載されている方の記事が大変気になるので、拝見することにしました。

お名前からして専門家…と思われますが…


記事がたくさん出ていることも注目されていることも含めて、本物の専門家でした。
技術系の記事になるからかもしれませんが、無名の新人クリエイターの参入障壁が高そうな気がしてなりません。


記事タイトルをテキストマイニングにかける

さて、Topクリエイターの方の凄さを見た後は、 記事のタイトルも分析したいと思います。しかしクリエイターの名前と違って、一致するものはありません。

ここで出てくるのが、テキストマイニングです。
テキストマイニングって? という方もおられるとおもうので、ChatGPTに簡単に解説してもらいます。

<プロンプト>
テキストマイニングを を小学生でもわかるように丁寧に解説して


想像してみてください、あなたが図書館にいて、とてもたくさんの本を読みたいけど、全部読む時間がないとします。でも、その中にはあなたが探している情報や、おもしろい話がたくさん隠れているかもしれませんよね。ここで「テキストマイニング」という魔法を使います。

テキストマイニングは、コンピューターがたくさんの本や文章をとても速く読んで、大切な情報を見つけ出してくれる方法です。例えば、どの本にどんな話が書いてあるか、どんなキーワードがよく出てくるか、人々がどんな感情を持っているか(うれしい、かなしい、おこっているなど)を教えてくれます。

コンピューターは、文章の中からパターンやルールを見つけ出し、私たちが興味のある情報を簡単に見つけられるようにしてくれます。それはちょうど、宝探しで宝の地図を持っているようなものです。地図があれば、宝を探すのがずっと簡単になりますよね。

たとえば、たくさんの人が書いたレビューや意見から、みんなが好きなアイスクリームの味や、あまり好きではない味を速く見つけることができます。また、科学の実験でどんな発見があったかや、新しいゲームについて人々がどう思っているかもわかります。

つまり、テキストマイニングは、私たちが知りたいことを早く、簡単に見つけるためのコンピューターの力を使った方法なんです。




ちょっと情緒的すぎる気もしますが、 ChatGPTはテキストマイニングも可能だそうです。

<プロンプト>
テキストマイニングってできる?


はい、テキストマイニングは可能です。テキストマイニングは、大量のテキストデータからパターンやトレンドを発見し、情報を抽出するプロセスです。自然言語処理(NLP)、統計学、機械学習などの技術を使用して、テキストデータを分析し、有用な情報を抽出します。

テキストマイニングにはさまざまな応用があります。例えば、ソーシャルメディアの投稿からの感情分析、顧客のレビューからの重要なフィードバックの抽出、科学論文やニュース記事からのトレンドの特定などがあります。

特定のタスクやデータセットに関するテキストマイニングの実装や質問があれば、もっと具体的に教えてください。




ChatGPTもやる気ですので、早速、実践します。


タイトルの傾向をChatGPTに聞いてみた

まずはざっくり、ChatGPTに聞いてみます。

<プロンプト>
100件のテキストから、どんな傾向があるかを教えて
全てChatGPT関連の記事であるため、その点の言及はしないでください


このテキストには、ChatGPTに関する100件の記事のタイトルが含まれています。様々なトピックがカバーされており、以下のような傾向が見られます:

  1. 実用的な応用例の探求:記事の中には、ChatGPTを使って特定のタスクを解決する方法や、特定の分野での活用法(英語学習、ブログ記事の作成、プログラミング、美術作品の作成など)を探求するものが多数あります。

  2. 教育的な活用:ChatGPTを教育ツールとして利用する方法に焦点を当てた記事が複数存在します。これには、学習支援、教材作成、言語学習などが含まれます。

  3. 技術的な比較と分析:ChatGPTと他のAI技術やバージョン(例えば、GPT-3.5とGPT-4の違い)、または他の生成AIとの比較を行う記事があります。

  4. 創造性と芸術:ChatGPTを使用して創造的なプロジェクトを行う記事も見られます。これには、絵本の作成、漫画、音楽、美術などが含まれます。

  5. 社会的、倫理的考察:ChatGPTの社会的な影響や、技術の倫理的な側面を探る記事がいくつかあります。

  6. プラグインと統合:ChatGPTのプラグイン機能や、他のサービスやツールとの統合に焦点を当てた記事もあります。

これらの記事は、ChatGPTの多様性とその応用可能性の広がりを示しています。技術の具体的な活用方法から、その影響や可能性に関する深い考察まで、幅広いトピックが探求されています。




なるほど。実用性重視の話題が多いようです。
なおりんが扱っているような、創作は、創造性と芸術の話題も含まれますが、いずれにせよ、多くがChatGPTをどう使うか? という記事のようです。ここで有料noteとの関連が出てきたら面白かったのですが、ChatGPTの人気記事は、ChatGPTそのものに焦点を当てた真面目な記事が多いと考えられます。

ChatGPT、すごいですね。
しかし、綺麗にまとまりすぎてしまって、それぞれの話題がよくわかりません。 ChatGPTに聞いても上手く答えが返ってきません。

ここはやはり、定量分析か? と言うことで、比較的単純と思われる単語の頻度分析を見て見ましょう。


記事タイトルに含まれる単語の頻度 by ChatGPT - To be Continued!

では、記事タイトルの頻度の分析をしたいと思います。
より多く含まれている単語があれば、少なくとも記事作成時点では、それが注目のTopicと言うことになります。

単語頻度分析 と言われると、なんだか聞きなれない言葉かもしれませんので、ChatGPTに解説をお願いしましょう。

<プロンプト>
単語頻度分析 を小学生でもわかるように丁寧に解説して


単語頻度分析とは、文章や本、ウェブサイトなどに出てくる単語がどれくらいの回数使われているかを数えることです。これをすることで、その文章が何について話しているのか、どんな単語が重要かがわかります。

例えば、ある本で「犬」という単語が100回、「猫」という単語が50回出てきたら、「犬」についての話が多いことがわかりますね。また、学校の授業でよく出てくる単語や、友達との会話でよく使う単語を調べることもできます。

単語頻度分析をする手順は、大きく分けて3つあります。

  1. 単語を数える準備をする: まず、文章から不要なもの(句読点や特別な記号など)を取り除きます。そして、文章を単語に分ける必要があります。これを「トークン化」といいます。

  2. 単語を数える: 次に、各単語が何回出てきたかを数えます。例えば、「りんご」が3回、「みかん」が2回といった具合です。

  3. 結果を見る: 最後に、どの単語が多く使われているかを見て、その文章や話の主な内容を理解します。

単語頻度分析は、文章の内容を理解するのに役立つだけでなく、新しい単語を学ぶのにも役立ちます。また、どのような言葉がその文章の中で重要かを知ることができ、言葉の使い方を学ぶのにも使えます。

子供たちがこれを学ぶことで、読書や学習に対する理解が深まり、楽しみながら言葉を学ぶことができるようになります。




これなら簡単に表で表すことができそうです。
というわけで、ChatGPTに単語の頻度分析をお願いします。

なぜか1度エラーとなり、「私の前の試みで使用するライブラリをインポートするのを忘れていました。この問題を修正して、テキストの単語頻度分析を正しく行います。」 と告げて再度挑戦。

以下の結果を得ました。


ChatGPTによる単語の頻度分析結果


明らかに何かがおかしい…というかきちんと単語が区切れていません。
何か問題があるようです。

次回の記事は、この原因を探るところから始めたいと思います。
つづく。



いただいたサポートはChatGPT有料版の費用に使わせていただきます!