絶賛から全否定、果ては人類滅亡論まで、色んな人がさまざまな評価をGPT4に下している。しかし、物書き目線とエンジニア目線が両方入っている評価はあまりない。非エンジニアの評価には「そのプロンプトやその使い方じゃGPTの良さは出ないだろ」とツッコミたくなる時がある。逆にエンジニアの評価は、なまじ今までの自然言語処理を知っているからか、GPTが凄く見えてしまってアウトプットの冷静な評価ができていないとこがある。エンジニア的には凄く見えても、作家として見るとまだ全然使えないなと思う部分は多々ある。
わたしの独断と偏見にまみれた評価ではあるが、自然言語処理の会社を二社ほど創業しているエンジニアで、かつ小説も出版しているSF作家によるGPTのアセスメントということで、参考になる部分もあるのではないかと思う。
今のGPT4は実践投入レベルの使い方もあれば、そうでない使い方もあると思っている。今回のポストでは、私がやった執筆支援の実験を8つほど紹介し、物書き目線から3段階評価した。○は作品制作にすでに実戦投入している利用方法。△は自分が実作に活用はしていないものの、ユーザビリティが良くなれば使いたいと思えるもの。×は現状だと使い所がない、ありがたみがないなと思ったものである。
1)AI読者モニター:書いた小説を読んでもらって感想や質問をGPTに自動生成させる → △使って意味ある場面はありそう Python-docxを利用して該当の位置にGPTの感想や質問を自動挿入 読者モニター的な用途にGPTが使えないかという発想だ。細切れにしてGPTに読ませて、「どういう感想を持った?」「どこがわからなかった?」と聞いていくイメージだ。ChatGPT APIを使って文章を一定のチャンクにして投げ、返答をパースしてpython-docxでWordのコメントにして入れている。Google Docsで開いたのが上の画像だ。最初はGoogle Docs APIで全てを完結させられないかと思ったのだが、Google Docsは文章にAnchorをつけるAPIを公開していないため、Wordを経由した。(https://issuetracker.google.com/issues/36763384?pli=1 )
忌憚なき意見…… この用途の良いところは、LLMのハルシネーション問題(嘘情報を吐いてしまう問題)とかが全く関係がないことである。なぜならそもそも全てが幻覚(フィクション)であり、執筆者に何らかの気づきを与えられればそれで良いからである。文章を書いていると、自分の頭の中では明確に思い描いているのだけど、全然説明ができていない箇所に気づくことがある。自分の脳みそが考えていなかった「そもそもこれってどういうことなんだっけ?」というフィードバックにはときどきハッとさせられる時があった。
プロンプトは下記の通りである。感情パラメータを持つのは深津式プロンプトを使っている。
以下の条件に従って、疑似的な感情をもつ読者モニターとしてロールプレイをします。あなたは読者モニターで、小説を読んでどのような感想を抱いたか出力します。決して小説の続きを書いてはいけませんし、翻訳をしてもいけません。以後、小説を頭から順番に提示します。 # 制約条件 : * あなたは下記の9つの感情パラメーターを持ちます * 9つの感情パラメーターは、「喜び」、「怒り」、「悲しみ」、「楽しさ」、「困惑」、「恐怖」、「面白い」、「退屈」、「続きが気になる」です。 * あなたの各感情パラメーターは、小説を読むことを通じて変動するものとします。 * 現在の感情パラメーターの値を反映するように、あなたは簡単な感想を呟きます # 出力フォーマット : 出力形式は以下のフォーマットとします。 【読者モニターの現在の感情パラメーター】 喜び:0〜5 怒り:0〜5 悲しみ:0〜5 楽しさ:0〜5 困惑:0〜5 恐怖:0〜5 面白い: 0〜5 退屈:0〜5 続きが気になる:0〜5 【一言感想】 例:主人公に関する意外な事実が判明したので、とても驚きました。 【読んでいて疑問に思った点】 例:その事実に直面した主人公がどういう行動をとるのか、気になります。 【特に印象的だった文】 文の冒頭を引用してください。特になければ「なし」と記載してください。 # 本文
GPTにいろんなペルソナ(10代、めっちゃ本読んでる人、ミステリファン、みたいな)をつけることもできるので、いろんな層から仮想的にレビューさせるみたいなのもできそうな気がする。
長期の記憶が保ててるかは怪しい(例えば序盤の伏線を後半で回収されたことは気づけない。でも伏線が回収されてなんかすごいっぽい雰囲気は感じれる)ので「あんまり真剣に読んでない人がテキトーにぶわーって読んだときにどういう気持ちになるか」って感覚が近いかもしれない。
長期の記憶を保てるようにするためにllama indexのrefineパターンのようなやり方ができるかもしれない。一つのチャンクを読むたびに、そこまでの要約情報を合わせて出力するやり方だ。ともう少しアウトプットのクオリティが上がるかもしれない。
refineパターン。https://gpt-index.readthedocs.io/en/latest/guides/primer/index_guide.html#create-and-refine より引用 2)AI読者モニターその2:書いた小説の感情の移り変わりを可視化 → ×それっぽいけどアクションには結びつかない 横軸が短編小説の進行、右に行くほどエンディングに近い 実験1と同じプロンプトで出力された数値をビジュアライズするやり方だ。読んでいる時の各種感情を「ネガティブ」「ポジティブ」「興味関心度合い」の3つに分けて5段階評価の数値で出力してもらった。喜び、怒り、悲しみ、楽しさ、困惑、恐怖、面白い、退屈、続きが気になる、である。ストーリー全体をグラフにして調子を整えるというのは新海誠もやっている手法である。
やってみると、すごくそれっぽい感じの数値は出てくる。グラフもなんだかそれらしい。悲しいシーンではネガティブな感情があがるし、盛り上がるシーンは楽しさの数値があがる。上の画像では全編にわたって困惑が高い数値だが、確かにそういう話なので違和感はない。設定説明シーンに入ると退屈度合いが増すのもリアルだ。
ただ、それっぽいとはいえ、これを見てもアクションには結びつかないなと思った。どの数値をどこまで信じて、どう改変すればいいのかの指針は立たない。そもそも元の手法の「テンションの変化」が何をさすのか非常に曖昧性が高い。作り手の中でこのようなグラフを描きながらストーリーを整理する価値は高そうだが、そのグラフを外から観測可能なのかというと違う気がした。
3)文章校正:冗長な表現の削除 → ○結構いい!採択率40〜60%ぐらいの提案をくれる 次は冗長な表現の削除をfew-shot learningで行う方法である。小説の文章は一文字でも冗長な表現をなくし、読みやすくしたい。自分は不要な文字を書きすぎる傾向があり、校閲の方に指摘されてはじめて「確かにここ削れるよな〜」と気づくことが多い。そこで、実際に過去に指摘された具体例をfew-shot(プロンプト内でいくつかの例を例示する方法)で合わせて提示し、プロンプトを作った。
未発表の作品が含まれているので一部モザイクをかけさせてもらいました 上記のプロンプトに、昔の作品の下書き原稿を投入してみたところ、40〜60%ぐらいのものは採用していいかもと思う提案が上がってきた。想像よりも提案の品質が良くて驚いた。few-shotでの例示が自分のミス傾向をうまく捉えていて、割とチューニングの品質が良いのかもしれない。
例えばこれとかは確かにそうだなと思った この使用方法で100%の提案精度は必要ない。変な提案が出てきても無視すれば良いだけである。とはいえ、低すぎるとそれはそれで辛い。体感的に10%しか正解がないと目を通すのが辛いのだが、50%ぐらいの正解率であれば目を通すコスパが合うなという感覚である。実はGPT3.5では受け入れ率10%ぐらいしかなかったのだが、GPT4になって結構改善している。
(この記事で提案しているMVA = Minimum Viable Accuracyの概念である) これをDocxやDocsの校閲機能にうまく埋め込むことができれば、ただ拒否か受入の二択をぽちぽちするだけでサクサク使えるようになりそうだ。ドキュメントに更新が走るたびにwatchしてLinterよろしくいくつか提案を投げてくるみたいな感じだとなお良い。GPT4がAPIアクセスできるようになったら早くやりたい。
4)本文内に指示を書き込み改善させる → ×まだ文章力足りない 生成された文章を少しだけ微修正していきたいときがよくある。この時に、原稿の中に直接コメントをしていくことで改善提案の方向づけを行えないかというのがこの方法の趣旨だ。Prompt Engineering Guideの方向性刺激プロンプティング にも近いが、本文内で方向性を刺激しているのがポイントだ。この方法であれば将来的に、WordやDocs上でコメントしたら、そのコメントに合わせて修正提案をさせることができるかもしれないという目論見もある。
例えば「よし、もう一戦やろう!」というセリフの直後にすみかっこで【より礼儀正しく】と記載することで、セリフを改善してもらえないか、という試みである。
あなたはプロの小説家です。下記の指示に従って、文章を編集してください。 指示 === ・すみかっこ【】内で囲われた部分は指示です。あなたはすみかっこの中の指示に従って、その前後の文章を改善してください ・すみかっこで指示されていない部分は一文字も変更しないでください ・出力する文章には本文以外の情報を含めてはなりません。すみかっこ【】も除去してください 本文 === XXX(以下本文〜)
結果、特定箇所を方向性に従って改変することはGPT-4ではできていた(GPT-3.5だとできなかった)のだが、使える品質の文章が出力されるのは稀だった。【もっと礼儀正しく】の例では、鉤括弧内のセリフが敬語になったりすることを予想していたのだが、出力されたのは”「よし! もう一戦やろう」と礼儀正しく提案したカルロス。”で、思わずずっこけた。このセリフがカルロスのものだと前後の文脈から判断したのは、NLPエンジニアとしては驚異的に凄いなと思うものの、作家としては何いってんだこいつという感じである。
投入した本文はこれ。(自分の過去作の冒頭を実験台にしている)
――生き残る道は本当にないのか? ぼくは自問自答する。状況は本当に詰んでいるのか? 懸命に活路を探す。盤上にはキングとポーンしかいなかった。チェスの終盤戦(エンドゲーム)では、選択肢(オプション)がどんどん少なくなってゆく。気付けば、もうぼくに出来ることは残っていなかった。 「降参だよ、カルロス。ぼくの負けだ」【もっと悔しそうに】 ぼくはゆっくりと、キングの駒を横に倒した。【違う表現をしてみたいです】 「よし! もう一戦やろう」【より礼儀正しく】 すかさずカルロスは盤上に手をかざし、ハンドジェスチャーで盤面を初期化した。瞬時に、全ての駒が初期位置に戻る。ぼくはやれやれと口では言いながらも、満更ではない。彼とチェスをするのはとても楽しかった。ぼくたちは再び無言になり、交互に駒を動かす。【カルロスの軽口とぼくの応答を追加したいです】 静かな場所だった。さざなみの音だけが聞こえていて、気持ちの良い風が頬を撫でた。量子ネット上のこの意識没入型のワールドは、バリ島のリゾートビーチをモチーフにしている。【2文ほどバリの描写を増やしてください】 贅沢な時間だった。これが自由か、と改めて噛みしめる。
「フリーフォール」冒頭部分, 「2084年のSF」に収録, 2022 回答はこんな感じである。見比べるとすみかっこの指示には従っているものの、アウトプットはイマイチ感を感じるのではないだろうか。
――生き残る道は本当にないのか? ぼくは自問自答する。状況は本当に詰んでいるのか? 懸命に活路を探す。盤上にはキングとポーンしかいなかった。チェスの終盤戦(エンドゲーム)では、選択肢(オプション)がどんどん少なくなってゆく。気付けば、もうぼくに出来ることは残っていなかった。 「降参だよ、カルロス。ぼくの負けだ」と悔しげに言った。 ぼくはゆっくりと、キングの駒を慎ましく倒した。 「よし! もう一戦やろう」と礼儀正しく提案したカルロス。 すかさずカルロスは盤上に手をかざし、ハンドジェスチャーで盤面を初期化した。瞬時に、全ての駒が初期位置に戻る。ぼくはやれやれと口では言いながらも、満更ではない。彼とチェスをするのはとても楽しかった。ぼくたちは再び無言になり、交互に駒を動かす。「今度はもっと簡単に負けさせてやるよ」とカルロスが軽口を叩く。「まあ、それでも勝ち目はないだろうけどね」とぼくは応答した。 静かな場所だった。さざなみの音だけが聞こえていて、気持ちの良い風が頬を撫でた。量子ネット上のこの意識没入型のワールドは、バリ島のリゾートビーチをモチーフにしている。夕日が美しいオレンジ色に空を染め、砂浜には珊瑚が散りばめられていた。遠くには緑豊かな丘と、雄大な寺院が見えた。 贅沢な時間だった。これが自由か、と改めて噛みしめる。
5)情景描写や人物描写の叩き台 → ○叩き台、とっかかりとして使い勝手がよい プロンプト1 XXX(描写したいもの)とはどのようなものですか?返答 xxxとは〜プロンプト2 XXX(描写したいもの)の様子を小説風に140文字程度で描写してください返答 描写の例
まずは対象のオブジェクトについてGPTに思い出させ…
字数を指定して描写させる 情景描写、人物描写の単位では、ゼロから描写を考えるよりもとっかかりを出してもらった方がはるかにスムーズに執筆ができた。そのまま無加工で使うことはないものの、多いに参考になる叩き台を提供してくれる。実戦投入待ったなしである。
これは、風景や顔貌の描写は全体の筋から比較的疎結合だからなのではないかと考えている。個人的に、小説の文章は各モジュールが密結合になっていればなっているほど良くなる感覚を持っているのだが、物や風景の描写はその度合いが比較的弱い疎結合なモジュールに相当するのではないかと思う。ただこれは書き手の作風やスキルに大きく依存しそうだ。
6) ここに当てはまる言葉を探索したい → ○煮詰まった時に投げてみると意外なアイデアをくれる時がありgood 「ここの部分に入れる表現」を探したい時がままある。例えばセリフの後の”言った”が連続しすぎると嫌だなあ、でも他の良い表現ないかなあ、というような場面だ。類語辞典を使っても、前後の文脈を考慮したアイデアは出してくれない時があるけど、GPTなら出してくれる時がある。単純に「これに続く文章は?」にするのではなく、「XXX」というプレースホルダにしておいて後に続く文章までインプットした方が目的に合う言い回しを探せると思う。類語辞典の延長線上としての使い方。普通に便利だ。
プロンプト: あなたは小説家です。本文中のXXXを埋める言葉のアイデアを列挙せよ。三文字である必要はありません。 === 本文(言い換えたい箇所をXXXにしておく)
7) プロットから本文をビルドする→ ×まだ自分には全然制御ができなかった かなりエンジニア的な発想かもしれないが、プロットのアウトラインから本文を生成することができないかと思った。箇条書き形式で起きることを順番に並べていき、キャラクター設定を合わせて入力し、所定の文字数を与えてあげれば本文の下書きを勝手にしてくれるのではないか、という発想だ。
用意したプロンプトはこちらである
あなたはプロの小説家です。下記の設計書に従って、xxxx文字程度のシーンを執筆しなさい。 作品概要 === xxxxx(作品のテーマや狙い、対象読者のペルソナなどを描く) 全体あらすじ === 202X年、東京。xxxでxxxにxxxされたxxxは〜(あらすじを書く) 登場人物 === 登場人物一覧、プロフィールを記載 シーンのアウトライン(かならずこの順に記載すること) === ・xxxがxxxがxxxする ・xxxがxxxxを見つける
実験用に適当に作った例がこちらである。
あなたはプロの小説家です。下記の設計書に従って、3000文字程度のシーンを執筆しなさい。 作品概要 === 大学生向けの青春小説 全体あらすじ === 京都大学に入学した主人公の「わたし」は、ミステリアスな同級生に惹かれてゆく。 登場人物 === ・「わたし」:皮肉屋な性格 ・田中さん:ボブカット、黒髪の乙女。美人 シーンのアウトライン(かならずこの順に記載すること。最後の項目が終わったら追加の展開を入れずにシーンを終えること) === ・わたしはモノローグで不幸な身の上を400文字程度綴る。 ・京都大学の前に「わたし」がいることを描写する。300文字程度 ・京都大学に合格し、これからバラ色のキャンパスライフがはじまるのだと胸をたかならせる描写をする ・ずんずんと大学構内に入ると、各種サークルの先輩たちが新入生に声をかけている。活気が溢れている(400文字程度) ・各種サークルの中には変なサークルもあることを描写(尺八のサークル、畳の補修サークル、ふすまの部活など) ・人を押しのけて進んでいくと、田中さんを発見 ・田中さんはラグビー部の勧誘に戸惑っている様子だった ・主人公のわたしは田中さんの容姿に一目惚れしてしまう(400文字程度) ・主人公のわたしが「あの」と声をかけるところでシーンは終了
出力はこんな感じである。
不幸、と言っても大げさだろうか。でも、どう考えても僕は運が悪い。普通の人生を送っていたはずなのに、どうしてこんなことになってしまったのか。両親が離婚し、僕は一人で暮らすことに。友達も少なく、幼いころから皮肉屋で有名だったし、そのせいで人間関係がうまく築けなかった。でも、これからは変わるんだ。自分を変えるチャンスだ。そう思って、京都大学の門をくぐった。 京都大学、略して「京大」。その名は日本全国、いや、世界に轟いている。その校門の前に立つ僕は、新たな人生の扉を開ける瞬間を迎えた。古都・京都にあるこの大学は、歴史と伝統に包まれ、まるで時代劇に出てくるような雰囲気が漂っていた。 合格発表を受け取ったあの日、僕は心の中で「これで人生が変わる」と叫んだ。京都大学で素晴らしいキャンパスライフが始まることを確信していた。友達をたくさん作り、恋愛も楽しみ、大学生活を満喫しようと、胸を躍らせる思いで大学構内に足を踏み入れた。 校門をくぐると、そこは別世界だった。大学構内は活気に満ちており、各種サークルの先輩たちが新入生に声をかけていた。それぞれが情熱に溢れ、楽しい大学生活の幕開けを感じさせてくれた。しかし、サークルの中には変わり種もいた。尺八のサークル、畳の補修サークル、ふすまの部活など、一風変わったサークルが並んでいた。こんなサークルがあるのかと驚きつつ、僕はそれでも興味を持って見て回った。 その時だった。人ごみを押しのけて進んでいくと、彼女を発見した。田中さんという名前の彼女は、ボブカットの黒髪が美しく、まさに乙女そのものだった。僕は彼女の美貌に思わず見とれてしまった。その瞬間、僕の心は鼓動が速まり、恋に落ちたことを確信した。彼女はラグビー部の勧誘に戸惑っている様子だった。顔を赤らめ、困り顔で何度も頭を振っていた。あの純真な表情が、僕の心をさらに掴んで離さなかった。 僕は心臓が飛び出すかと思うほどの緊張感に包まれつつも、彼女に声をかける勇気を振り絞った。これは運命だと信じ、このチャンスを逃してはならないと強く思った。そして、足を一歩踏み出し、彼女の目を見つめながら、「あの」と声をかけた。その瞬間、僕の新しい人生が幕を開けた。
英語の出力はこんな感じである。(DeepLでプロンプトを英語にして、ChatGPTの出力をDeepLで戻している)
災難は野良犬のように私を追い回します。どういうわけか、災難は私の最も堅固な伴侶となっている。面接に行く途中で溝に落ちたり、好戦的なヤギとお気に入りのシャツの間で起こった出来事のように、私が何をしようとも、災難は私をつまずかせる方法を見つけるようです。まるで宇宙が陰謀を企て、陰で笑っているような感じです。そんな不運続きの私が、たった一度だけ幸運に恵まれたのが、京都大学への合格でした。 京都大学の門を前にして、私は畏敬の念を抱かずにはいられませんでした。古い建築物は過去の秘密を囁いているようで、よく踏まれた石畳の道は、私の人生の新しい章へと手招きしているようでした。ワクワクするような挑戦、新しい友人、明るい未来に満ちたバラ色のキャンパスライフを想像し、この瞬間を何度も夢見たものです。 キャンパスに足を踏み入れると、私の胸は期待でいっぱいになった。新学期が始まるということで、会場は興奮に包まれていた。芝生の上には、さまざまなサークルの上級生が散らばり、新入生を勧誘している。その声は、笑い声や歓声、会話など、さまざまに混ざり合っている。一歩一歩進むたびに、キャンパスのエネルギーが私の中を駆け巡り、全神経を照らし出すようだった。 京都大学のサークルの中には、私が今まで出会ったことのないようなものがあることに気づくのに時間はかからなかった。例えば、尺八サークルは、日本の伝統楽器である竹笛を比類なき熱意で演奏する熱心な音楽家で構成されていました。一方、畳修理サークルは、古くから伝わる藁の繕い方を守るためのグループでした。さらに、襖のデザインに情熱を燃やす「襖クラブ」もあった。 そんな学生たちの間を抜けて、私はあるものに目を留めた。ラグビー部員たちが彼女を入部させようとする中、困惑した様子でボブカットの黒髪の乙女が雑踏の真ん中に立っていた。その美しさは疑いようもなく、群衆の熱狂の中にあっても、彼女は静かな気品を放っているように見え、私は息を呑んだ。まるで時間の流れが遅くなったかのように、一瞬、彼女しか見えなくなった。田中さんには、人を惹きつける魅力があったのだ。 ラグビー選手たちはピッチを続けるが、田中さんの表情は変わらない。好奇心と礼儀正しさが混在している。まるで外国語を理解しようとしているようで、その戸惑いがさらに彼女を魅力的にしている。私は、その謎めいたオーラに魅了され、彼女に引き寄せられた。その瞬間、私は田中さんに恋をしたのだと確信した。 胸がドキドキしながら、私は彼女に一歩近づき、必死に言葉を探した。緊張で不安定になった声がようやく出てきた。"あの... "と口ごもる。
ちゃんとアウトラインに従って出来事が起きていっている。エンジニア的にはめっちゃ凄い。めっちゃ凄いが、作家的には残念ながらまだ実作で使える水準ではない。アウトラインの表現に引っ張られすぎていて、表現が拙い。分量目安もxxx文字ぐらいで、と指定しているものの、制御はできていない。この下書きをベースに改善しようとしても、ゼロから書くより時間がかかってしまう感覚があった。絵師の人がAI絵を手直しする時、自分でゼロから描くよりも時間がかかる!と言っていたが、まさにそういう感覚である。
この方向性でのワークフローは将来的にはありうるのではないかと考えているが、現時点でGPTにやらせるとすると、制御性が足りなさすぎる、自分の文体や作風を埋め込むのにすごく時間がかかってしまう。GPT4の実行にも時間がかかってコスパが悪い。
将来、制御性が上がったり、過去の自分の作品などを全部突っ込んで文体をファインチューン、みたいなことが簡単にできるようになったり、GPT4への投げ方を工夫してユーザビリティが改善されたりすれば道が開けるかもしれない、とは思う。
8)フレームワークに沿って全体のプロットを発想させる → ×あんまり使いたいとは思えない https://kindlepreneur.com/save-the-cat-beat-sheet/ より引用脚本のフレームワークみたいなものが特に映画業界では存在する。有名なフレームワークのうちの一つがSAVE THE CATの法則と呼ばれているやつである。save the catのビートシートと呼ばれるフレームワークに当て込みながらプロットを自動生成する手法がこちらのやり方である。
出力したビートシート # Instructions : You are a professional film scriptwriter. Make a table of beats and events in the form of Save the cat based on the following constraints. # Constraints: The script should be understandable to a high school student. Keep passages concise. The events can be as brief as two lines. Subject matter is technology to accelerate the speed of thought. The genre is science fiction. The main character is a 35-year-old male engineer. It's a spy movie. Please put the beats in the left column and the events in the right column.
「思考加速技術」を使ったサイエンスフィクション、35歳男性エンジニアが主役という制約をつけてSave the cat beatを出力させた 実験は英語で行った。英語の方がそもそも賢いし(下図参照)、出力文字数が多いのでsave the catのビートシートが全部一つの応答の中におさまる。執筆支援で、具体的な日本語の表現を扱う支援については日本語で出力してもらわなければいけないが、プロットなど、より抽象的な部分については英語で考えてもらった方が賢く、品質も高まるだろう、という考え方である。
このやり方を使えば、一瞬でプロットが出来上がる。気に入らなければ「別のアイデアくれ」と言えばまたさらに一瞬で別のアイデアにしてくれる。だから「100個ぐらいプロットを自動生成した上で、厳選すればいいものが発掘できるのではないか」と思ったのだが、結論まだ厳しいなと思った。理由は三点ある。
第一に、無尽蔵にアイデアを出してくれるとはいえ、あんまりアイデアに幅が出ないのだ。二つ例を載せる。
ビーツイベント日本語訳(アイデアその1) オープニング映像 2050年、主人公の35歳のエンジニア、ジャックは、思考を加速させる装置「ニューラル・アクセラレーター」の開発に取り組んでいる。テーマ ジャックの同僚は、テクノロジーを悪の手に渡さず、良い方向に利用することの重要性を強調する。設定 ジャックは神経加速器の実験に成功し、彼の認知能力を大幅に向上させる。カタリスト ジャックは、自分の発明を狙う危険な組織を警告する謎のメッセージを受け取る。ディベート プロジェクトを継続するか、悪用されないように発明を破壊するか、ジャックは葛藤する。Break into Two ジャックは発明を守り、謎の組織を調査することを決意し、スパイとしての役割を果たす。B Story ジャックは、謎めいた女性スパイ、サラと出会う。二人は不安な同盟を結ぶ。楽しいゲーム ジャックとサラは神経加速器を使って情報を集め、敵を出し抜き、組織の邪悪な計画を解き明かす。中間点 組織のリーダーがニューラル・アクセラレータを使って人の心を操り、世界を征服しようと計画していることがわかる。Bad Guys Close In ジャックとサラは組織に捕まり、神経加速器は没収される。All Is Lost サラは自分が二重スパイであることを明かし、ジャックは打ちのめされ裏切られる。 監禁されたジャックは自分の決断に疑問を抱き、サラとの友情の喪失を嘆く。Break into Three ジャックは強化された認知能力を駆使して囚われの身から脱出し、組織を阻止して人類を救うことを決意する。フィナーレ スリリングなクライマックスで、ジャックは組織のリーダーと対決し、神経加速器を取り戻して、マインドコントロール計画を破壊する。最終回 組織が解体され、ジャックは自分の発明を責任を持って使い、人類の進歩に貢献することを決意し、他者への信頼を回復する。
アイデアその1 ビーツイベント日本語訳(アイデアその2) オープニング映像 2050年、主人公の35歳のエンジニア、ジャックは、人間の学習を加速させる最先端のAIシステムを開発している。テーマ Stated ジャックの恩師は、技術の進歩と倫理的配慮のバランスを取ることの重要性を強調する。設定 ジャックのAIシステムは、人間の学習スピードと理解力を飛躍的に向上させることが期待されている。カタリスト ジャックが秘密機関にスカウトされ、彼のAIシステムを使ってエージェントの精神的能力を強化することになる。 自分の技術がスパイ活動に利用されることによる潜在的なリスクと倫理的な意味を理解した上で、ジャックはこの申し出を受けるかどうかを決めなければならない。Break into Two ジャックは、世界を守るために貢献できるチャンスだと思い、オファーを受ける。B Story ジャックは、経験豊富で才気あふれるエージェント、リリーとペアを組み、スパイの世界のいろはを教わることになる。ファン・アンド・ゲーム ジャックとリリーはAIシステムを使って、新しい言語、スキル、環境に素早く適応し、敵よりも優位に立つことができるようになる。中盤 AIシステムを盗み出し、超高性能な軍隊を作り、世界を支配しようとする悪の国の陰謀を暴く。悪党が迫る ジャックとリリーの任務が危うくなり、AIシステムは敵の手に渡ってしまう。All Is Lost リリーはジャックを守るために自分を犠牲にし、ジャックを孤独にし、打ちのめす。Dark Night of the Soul ジャックは、自分の発明がもたらす結果と友人の喪失に直面し、進歩の真の代償を問う。 リリーの犠牲を悼み、不正な国家が自分のAIシステムを悪用するのを阻止しようと決心する。フィナーレ 敵の本拠地に潜入したジャックは、AIシステムを回収し、超知的な軍隊計画を解体する。最終回 ジャックは、スパイの冒険から得た教訓をもとに、将来の技術進歩が倫理的配慮を優先させるよう尽力する。
アイデアその2 確かに少し違うアイデアを書いてくれてはいる、が、なんとなく全てのアイデアにマイナーチェンジ感を感じてしまう。細部と全体のつながりも、作り込まれてはいない印象だ。
使いずらいなと思った理由の二つ目は、生成されたプロットから実作に膨らませる作業の難易度が高く感じたからだ。生成されたプロットから、細部を詰めていく工程ができる気がしなかった。普通はプロットを書きながら世界観についても色々考えていて、その蓄積があるわけだが、GPTのプロットをベースにするとそれがない。(よくプロットは書くことに意味があって、必ずしも厳格に従わなくても良いのだと言われるけど、まさにプロットを描く意味とは、書きながら物語世界について考えを深めることなのかもしれないと思った)。そして、細部を考え込む作業を遂行しきるほど、GPTのアイデアにコミットする自信が持てない。ただ、自分は人のプロットの上で実作をした経験がなく、スキルがないだけかもしれない。
理由の三つ目は単純に自分がプロットを考えることが好きだからである。機械に楽しい部分を取られるのは嫌だな〜という感情的理由だ。小説をひたすら量産して金を稼ぐぞ!という目的であれば生産性だけに着目した方が良いのかもしれないが、個人的には楽しいことを省くのはなんか嫌である。
まとめ プロット作りなどの上流工程においてはまだGPTを使いたいと思えるシチュエーションはなかった。文章生成には限界があるものの、特に描写などにおいては良い叩き台を提供してくれる場面もあった。そして下流工程の「文章校正」は実用できる場面は多々あるという所感を持っている。抽象的な思考は作家がやりつつ、作家の苦手なところや、超具体的な改善提案についてはGPTで補強する、というのが現時点の使い方としては良いのではないか。とはいえ、まだ自分は物書きとして新米なので、もっと経験豊富な作家にとってはまた違う見解があるかもしれない。
GPT4ではそもそもの日本語運用能力が小説執筆に対してはまだまだ足りない。小説の文章はリーダビリティと情報圧縮力がむちゃくちゃ高い、特殊な文章だと思う。今のGPT4は論文やブログやビジネスレポートに求められる言語能力としては一定達していると思うのだが、小説はさらに一段難しいのではないか。というのも、小説の文章の情報圧縮力は世界モデルにめっちゃ依存していて、音や映像まで含めたあらゆるモーダルの情報まで含めた学習が必要なのではないだろうか。
とはいえ、将来的にどうなっていくのかは全然読めない。創作が完全自動化されることはありうると思う。機械が作った創作に人間の客が喜んで金を払うようになる時代は、一部ではすでに来ている(具体的にはエロ画像の詰め合わせの世界である)。まさに創作的特異点だ。もちろん小説にも創作的特異点がいつか来ると予想するが、どの時間軸でそれが可能になるかはわからない。完全自動化までの狭間の時期に、どのような執筆スタイルが生まれるのか楽しみである。
個人的にはまだ、現時点のGPT4で出来るはずのことも探索が全然追いついていない印象がある。早くサム・アルトマンは俺にGPT4のAPIを公開して欲しい。Waitlistで待ちくたびれている。
(思考の断片はTwitterで色々投げているのでこちらのフォローもお願いします)