見出し画像

007. ChatGPTのプラグイン「Link Reader」でAmazonの商品レビューを分析


本一冊丸ごとの読込は失敗!

前回は『スタンフォード式 最高の睡眠』という本一冊分のテキスト(原稿用紙200枚分!)を「Link Reader」プラグインを活用して、丸ごと読み込むことに挑戦しました。

が、残念ながら、ジピ君(ChatGPT)からその大きさのテキスト全編を対象にした構造分析や要約はできない、と言われてしまいました。

一方で、「深い眠りを得るためのコツは?」といったテーマや章(セクション)を限定して要点のまとめを依頼すると、まずまずの品質で答えを返してもらえました。

Amazonのレビュー分析に挑戦

今回の課題

さて、今回は同じく「Link Reader」プラグインを活用して、「私が愛用しているスマートウォッチ、XiaomiのSmart Band 7のオススメ理由を、Amazonのユーザーレビューから抽出する」という課題をジピ君と取り組んでみることにしました。

レビュー分析の前準備

Smart Band 7のAmazon商品ページに行き、星5つと4つの高評価レビュー38人分をコピペして、プレーンなテキストファイルを作ります。レビュアーとレビュアーの区切りをジピ君に明確に伝えるために、「役に立った」という文字列を「(レビュアー区切り)」に全置換します。

自前のサーバーuchimura.7の中にそのテキストファイルをアップして、URLを得ます。

そのURLにあるテキストファイルを分析対象とするよう、「Link Reader」プラグインを介して、ジピ君にプロンプトを出していきます。

結果・・成功と失敗!?

私としては、商品名ならびに内村セブンの名前通り、「Smart Band 7を買うべき7つの理由」を書こうと思いました。

とはいえ、いきなり7つに絞るのではなく、まずはできるだけ広めにジピ君にポイント拾い上げてもらおうと、20個の理由だしを以下のプロンプトで依頼してみました。

プロンプトのフォーマットは、深津式を私なりにアレンジしたものです。こちらです。

いかがでしょうか。Smart Band 7の良い点20個としては、どれも間違っていないと思います。

実際、私自身も「そう、そう、それな!」と思えるポイントが漏れなく入っています。

次に、本来狙っていた7つの理由に私は自分で絞り込んで、優先順位もつけてみました。ポイントについていた数字を並べた上で、ジピ君に表示しなおしてもらいます。

思わず「いいね!」ボタンを押したくなりました。ジピ君、いい仕事してくれてます。ここまでを私が完全自力でやったら、何時間もかかってしまっていたでしょう。おそらく、ここまでの作業はざっと10分ほどです。

理由に沿ったレビューの「引用文」の抽出は失敗!!
さて、ここからが私が本当にやりたかったこと。7つの理由に沿って、それぞれ5人のレビュアーをピックアップ。実際にどう言っているかを、引用(抜き書き)してレビュアー名も添えてまとめることを、ジピ君に依頼してみました。すると・・・

あらら、レビューアー名がいきなり外国人名になっている! John Doeって誰? 100人も役に立ったって言っているし。 しかも、これは明らかに引用ではなく、ジピ君が勝手にでっちあげた文章。

実は、なんとか本物のレビュー分とレビュアー名をピックアップしてもらうべく、プロンプトの内容や形式をいじってトライしてみたのですが、できたのは嘘のレビュアー名がTakashi Satoとか日本人ぽい名前になったのみ。でっち上げは直りません。

内村の所感

失敗の理由は?
テキスト全体を見通したら「買うべき理由」の分析やまとめはできているのに、理由に繋がる個々のレビュー文からの引用ができないのはなぜか? 正直、わかりません。

考えられる一つは、プロンプト内でレビューの構造(レビュアー名、星の数、レビュアー名、レビュー本文・・)を明示はしたが、ジピ君がどこをどう見るか、判断できずに、でっち上げでごまかしたのかもしれません。

解決に向けての取り組み
プラグイン「Link Reader」には、URLで指定した先にあるテキストファイル全文を、完全にジピ君に読み込ませるだけの機能はないことは、前回のテスト(本一冊分のテキスト読込)でもわかっていました。

今回も、テキストエディタで確認したら52,000字ほど、つまり原稿用紙100枚分以上の分量があるテキストファイルになっていました。「Link Reader」で扱うには、単純に分析対象が大きすぎた可能性はあります。

ジピ君のネイティブランゲージが英語で、分析のために一旦英語化したところで、レビューアー名が訳がわからなくなってごまかした、、とか。

ベタのテキストではなく、レビューの場合は項目の構造があるので、.csvに変換した方が良かったかもしれません。次回以降の課題です。

やり残しはありそうですから、Amazon商品レビューの分析・まとめのテーマは、もうすこし深掘りしてみようと思います。

では、次回をお楽しみに!


この記事が気に入ったらサポートをしてみませんか?