以前にChatGPTを利用した、以下の記事を書きました。Copilotを利用してのGPT-4oでの分析と創作についてのお遊びです。「細雪」の4姉妹のプロファイリングをしてもらい、さらに一人一人の個性に合わせたデートプランを考えてもらいました。また、最後にデートの感想もそれぞれインタビューしてみました。
ChatGPTでは指示が雑だと、どうしててもファンシーな回答になりがちですが、プロンプトを工夫して具体的な指示をすることで、なかなかにファンタスティックなものへとなりなました。ただし、データソースが不明なので、純粋にAIが原書から生成した回答ではなく、ネット上に存在しているあらゆる考察記事や解説記事の影響も多分に受けているのではないか?だからこそ、こんなに創造的かつそれっぽい回答ができるのではないか?ということが気になっていました。
そこで今回は、ChatGPTではありませんが、GoogleのAIであるGemini 1.5を利用した話題の新サービスNotebookLMを使って遊んでみました。テーマは、NotebookLMを使って青空文庫から取得した「細雪」の全文のテキストのみをデータソースにしてGemini 1.5と戯れよう!です。
1.準備
まず、データソースとして青空文庫からテキストデータを取得します。NotebookLMはURLを直接ソースに指定する機能があるのですが、以下のUURLを指定してもうまくいきませんでした。
https://www.aozora.gr.jp/cards/001383/files/56698_59488.html
文字コードの問題のようです。ですので、コピペしたテキストファイルをソースに指定することにしました。この場合も文字コードはUTF8にするのがよさそうです。また、普通にダウンロードしたテキストファイルだとルビ情報が付いた変なテキストになるので、以下の「青空文庫 ルビ削除ツール:長文対応版」を利用しました。
http://www.kepe.net/ruby/index3.html
実際には、上、中、下の3冊分の本文を一つのテキストファイルにコピペして、それをデータソースとしました。
2.ノートブックガイド
チャットで壁打ちをするだけでなく、ノートブックガイドという機能がありますので、まずはこちらを試してみました。複数あるメニューの中で「タイムライン」は作成できず、「目次」はいまいちの内容になりましたが、残りの「よくある質問」「学習ガイド」「ブリーフィング・ドキュメント」に関しては実際に生成できたので、その結果を以下にコピペします。なお、これらの生成結果には、データソースにはない情報が含まれていました(映画の情報とか)。どうやらノートブックガイド機能の生成は、インターネットの情報も利用しているようです。
率直な私の感想としては、凄すぎて理解が追い付かない…。チャットでの "人間らしい" 壁打ちでの驚きとは別次元で、改めて生成AIのすごさと制度、実用性の高さを感じました。やれやれ滅入るぜ。
よくある質問
学習ガイド
ブリーフィング・ドキュメント
3.チャット画面の説明
左側にソース(「細雪」の全文テキスト)が表示されています。また、以下の例はチャットにて「登場人物を紹介して」と入力した回答です。(画像を拡大してください)回答欄の行末に①②などのリンクが張られていますが、これはデータソースの該当箇所の文節部分のリンクになっています。つまり、明確な根拠が示されています。※ただし、テキストデータとしてnoteにコピペをすると、この①②のリンクの情報は削除されてしまいます。
4.チャット機能(成功例)
ChatGPT同様に、チャットでの壁打ちができます。しかしデータソースは自分で指定したデータ(青空文庫から取得した「細雪」の全文のテキスト)に限られます。実際にチャットした内容に対する応答をコピペします
なお、かなり原資料な忠実な印象です。また、以下のコピペには表示されていませんが、実際にはかなり細かく引用原文へのリンクがついています。
蒔岡家四姉妹をプロファイリングをしてください
小説全体を通して、登場人物たちの行動や心情はどのように描かれていますか?
幸子は雪子の縁談についてどのように考えているか?
登場する食べ物や飲み物を列記して
登場する地名や場所、店の名前などを列記して
5.チャット機能(失敗例)
どうやら、ChatGPTとは異なり、創作の部分はあまり得意ではないようです。
・デートプランを考えて
・幸子を口説くとしたらどんなセリフがいい?
・最後に雪子が言いそうなセリフを考えて
といった内容を投げかけても、『提供された資料には、そのような情報は記載されていません』といったメッセージや、期待外れな回答しか得られませんでした。一方で、ではデータ解析的なアプローチは得意なのかと思って試した以下のような質問の回答も期待外れでした。不思議です。
・文字出現頻度分析をして
・雪子のセリフだけを抽出して
・「こいさん」という文字列を含む文を抽出して
6.感想
ChatGPTとのファンシーな壁打ちに比べると、まじめで面白くはない。でも、仕事や勉強、調査、資料作りのためなんかには、めちゃくちゃ便利に使えそう。また、応用範囲が広い実用的なツールで、マジでやばいんじゃないかと思いました。これまでは、なんだかんだで、ちょくちょくおちゃめな回答をするAIを見て、若干ながら上から目線でマウントを取れることができたけど、それも長くは続かなそうだ…
なおエンタメとしては、データソースを「細雪」だけでなく「山の音」と「音楽」も足したりて、マッシュアップな分析や考察をしてみるのも、また一興かもと思いました。とりあえず、青空文庫は全文テキストが得られるのでいろいろ楽しめそうです。
あと、いつまで続くがわかりませんが、これが無料で使えるのはすごいですね。レスポンスタイムもすごく短く、ChatGPTだとタイプライターとまではいいませんが、一昔前の家庭用のインクジェットプリンターのように、数行ずつ出力される印象でしたが、これは膨大な量の出力が一気に表示されました。ChatGPTやClaudeに後れを取ったGoogleが、無理して大判振る舞いをしているんじゃないかと思いますけど、一度味を占めたら、有料になっても手放せなくなるんじゃないかと心配です。