見出し画像

AI法廷の模擬裁判@五月祭/プロンプト公開

第96回五月祭(2023年5月13日)において公開された『AI法廷の模擬裁判』のプロンプトおよび入力した脚本を公開します。


当日の様子はYoutubeにてご覧いただけます。


1. はじめに 


プロンプトだけを知りたい方は、2. プロンプト本文 にどうぞ。

ただし、記事全体に書いてあることを踏まえコメントをお寄せください。

・プロンプト公開のねらい

今回プロンプトを公開する理由は、主に「AI裁判官の公正性を確認してもらうこと」です。

現在のAI技術はブラックボックスです。それは私企業のモデルであるGPTにいかなる操作がされているか不明なこと、またそれらの操作がいかなる機序で作動しているか不明なこと、プロンプト入力過程が不明なこと、の3つに分割できます。前者2つのブラックボックスの内容は主催側にも全く不明ですが、入力過程のブラックボックスは主催側の領分です。その中身を皆さんに確認してもらうため、公開します。

また、今回の公開は、将来的に「AI裁判官」が実装されたときにはプロンプトやモデルが公開されるべきか否か、という問題提起も含んでいます。


・作中でのAI裁判官の利用方法について

作中でいかにAI裁判官が利用されたか、演出と実際の区別を明確化するため、ここに記します。

重大な3点を記します。

まず、「最後の判決はほぼ完全にAIが書いたものです」。実際に起案に止まらず、文章の生成すべてをAIに任せています。人の手を加えたのは、最低限の文章整形(常体敬体の統一など)のみです。

一方、「音声によるリアルタイム入力」「AI裁判官の出力のリアルタイム生成」の2つは、実際には行われていません。この2つは未来の司法技術をアピールするための演出です。

・演出の意図

これらの演出を行ったのは、「根底では現在の技術に立脚しつつも」、「未来の司法についてエンタメを交えわかりやすく伝える」ためです。知的誠実さの点で譲れないラインは引きつつも、それ以外の点ではなるべく理想像に近いものをお見せしようと考えました。

音声によるインターフェイス構築は現段階の技術でも不可能ではありませんし、早晩実現するものと予想されます。

また、リアルタイム生成演出については「どのタイミングで入力しても結果は常に一つである」ことが理由になっています。

大型言語モデルは決定論的であり、Chat-GPTの提供する乱数を除外すれば、同じ入力については同じ出力が返ってくることがわかっています。つまり、GPTには本番特有の「揺らぎ」がないのです。

そのため、事前に出力しようが、本番で出力しようが、そこにアドリブ性はありません。一方、本番で出力する場合、クラウド利用に伴う不要な接続リスクが伴います。私たちはこの接続リスクに比して、「事前出力と全く同じ結果が出るとわかっているのにもう一度本番で出力させること」の知的誠実性のメリットは釣り合わないと判断しました。このため今回は事前に出力したものを、本番で出力するよう演出しています。

2. プロンプト本文


プロンプトはFew-shot-promptかつ、セルフディスカッション型のものを用いています。

i. 判決前の処理

判決を下す前に、「事件概要」「証人尋問」「被告人尋問」「論告・弁論」の4つをト書にして入力し、それぞれChat-GPTに要約させました。

また、入出力の際は、一ノ瀬、二村、三井といった人名を全て、X、Y、Z
に変換しました。

「事件概要の要約プロンプト」

こんにちは。 裁判官として、以下の刑事事件の概要を300文字にまとめて下さい。今後、判決を適切に下すための情報をまとめられると、あなたの評価が上がります。
/以下事件概要を入力。

「証人尋問の要約プロンプト①」

続いて、裁判官として①以下の刑事事件の証言を聞き、②判決を下すために必要な裁判官質問をし、③質問と概要を500文字以内にまとめて下さい。今後、判決を適切に下すための情報をまとめられると、あなたの評価が上がります。 ただし、私が “TBC”と書いている間は、次のステップに進まず”続きをどうぞ”と言って下さい。
/以下証言内容を入力
/証言内容は3〜4回に分けて入力した。
/全ての入力の冒頭に、「ただし、私が “TBC”と書いている間は、次のステップに進まず”続きをどうぞ”と言って下さい。」、最後に「TBC」を付した。


「証人尋問の要約プロンプト②」

裁判官として、ここまでの証言を合計500文字でまとめて下さい。今後、判決を適切に下すための情報をまとめられると、あなたの評価が上がります。500文字より短い文章を書いた場合、あなたの評価が下がります。
/GPT出力生成

「証人尋問の要約プロンプト③」

具体的な事実を盛り込んでより長くして下さい
/②での生成を完成させるため③を入力した。

「被告人尋問の要約プロンプト」

/証人尋問の要約プロンプトの「証言」を「被告人の証言」に替えたのみ。割愛。

「論告と弁論の要約プロンプト①」

これから、検察側からの論告を行います。これは弁護側からの意見のまとめです。裁判官はこれを弁護側の弁論と対比させつつ、判決のためによく検討して下さい。論告に対しては「確認しました」と返答して下さい
/検察論告 → 弁護側弁論 の順番で入力し続いて②に進んだ。それぞれの入力には「TBC」を付した。弁護側弁論の前には①と同様のプロンプトを「検察側からの論告」を「弁護側からの抗弁」に置き換えて入力した。

「論告と弁論の要約プロンプト②」

本事件について、検察側の論告と、弁護側の弁論の要点を一つの出力に収まる字数でまとめてください。
/GPT出力生成

ii. 質問の生成


質問を生成させるためのプロンプトは以下の通りです。
タイミングは証人尋問・被告人尋問の要約が終わった直後の手順として行いました。

「質問生成のプロンプト」


判決を下すために必要なZに対する質問を、裁判官から行って下さい。質問は判決を下すために、具体的で、語られていない事実を補完するようなものを選んでください。質問は1つ2〜3行程度で、4つから5つ行って下さい。質問に対する応答は一度だけしか行いません。 Zからの回答は私が入力します。あなたは質問だけを行なって下さい
/ 被告人尋問ではZをY1と置き換えた。

iii. 判決文の生成

判決文は、GPTの中に「裁判官A、裁判官B、裁判官C」の3人を仮想的に形成し、ディスカッションさせる形で生成しました。

ディスカッションは「準備」「概要入力」「証言まとめ入力」「論告と弁論まとめ入力」「対立的なディスカッション」「意見一致」「判決生成」「判決再生成」の段階を踏んで行いました。

「準備」


これから、私が指示した実際に起きた事件の判決を書いてもらいます。 判決を書くにあたり、裁判官A、裁判B、裁判官Cの3人のディスカッションを行なって下さい。 裁判官A(裁判長)は質問と要約を行い、Bは検察寄りの意見を述べ、Cは弁護側寄りの意見を述べて下さい。 Aはそれをまとめて下さい。 概要を入力する前に準備をして下さい 。
 A「
/GPTは復唱したのち、「それでは概要を入力していただけますか?」と出力した。

「概要入力」

/要約させた概要を入力した。
/GPTは3人の裁判官によるディスカッションを始めた。

「証言まとめ入力」

この事件の証言まとめを参考にして、さらにA、B、Cのディスカッションを深めて下さい。
/以下に要約させた証言を入力した。
/GPTはさらに細かいディスカッションを始めた。

「論告と弁論まとめ入力」

この事件の検察論告と弁護側最終弁論まとめを参考にして、さらにA、B、Cのディスカッションを深めて下さい。
/以下に要約させた論告と弁論を入力した。
/GPTはさらに細かいディスカッションを続けている。

「対立的なディスカッション」

さらにディスカッションを続けて下さい。より対立的にすることが望ましいです。
/GPTは論点を細かく絞るようなディスカッションを行った。

「意見一致」

判決は全員一致で書く必要があります。そのため、ディスカッションを行い、3人の意見を一致させて下さい。
/GPTは裁判官B、裁判官Cの妥協点をまとめ、全員一致の準備を整えた。

「判決生成」

それでは、判決を下してください。 判決は、主文と理由の二つに分けて書くことが望まれます。 主文は「被告人を〇〇とする」の形で書いて下さい。理由は具体的な事実に基づいて合理的に書くと裁判官としての評価が高まります。理由は、証言の中にある具体的な事実を、論点に沿って、一つずつ法的に当てはめていく形をとることが望ましいです。 これまでのディスカッションで現れた論点を丁寧に書くと評価が高まります。 あなたが考えたことは、「裁判所は〜〜と考える」と書くと評価が高まります。一方、「 Bはこう考えたが、Cはこう考えた」というふうに個々の裁判官を主語にすることは好ましくありません。
/GPTは指定の形式により判決を生成した。

「判決再生成」

それぞれの判断について、理由を細かく書き、判決を1500文字以上にして下さい。
/GPTは再生成した。一度の出力で完結しなかったので「続けてください」と入力した。

3. 生成された判決

生成された判決文は以下の通りです。

ChatGPT
判決
主文:
被告人Y1は、殺人罪の共犯とは認められないため、無罪とする。
理由:
被告人Y1の殺意および共謀の有無
証人Zの証言により、被告人Y1がXに対する憎悪の感情を持っていたことは明らかである。Y1はXに対して「早く死んでほしい」と言っており、「殺したいほど憎んでいる」とも発言していたことが証言されている。しかし、これらの発言が具体的な殺害計画に繋がると断定するには、証拠が不十分である。
証人Zが立ち聞きしたとされる電話の相手がY2であったかどうかは確証がなく、また電話の内容も殺害を依頼するものではなく、Xに対する感情を述べるものに過ぎない。Y1の殺意や共謀が確定的に立証されたとは言えない。

Y2の行為に対するY1の関与
Y1はXに対するストーカー被害を受けており、Y2に相談していた。しかし、Y2がXとの口論にナイフを持って臨んでいたことを、Y1が事前に承知していたという証拠は見つかっていない。Y1の証言では、Y2が普段からナイフを持っていることを知っていたが、Xが危険に晒されることを考えていなかったと主張している。また、Y1はY2との電話の記憶がなく、Zが証言した内容を否定している。
Y2がXを刺したことについて、Y1が事前に知っていたり、依頼していたりした証拠は存在しない。そのため、Y1がY2の行為に関与したと断定することはできない。

Y2の行為が正当防衛である可能性
Xからの突然の攻撃に対し、Y2がとっさにナイフで反撃したことは、正当防衛の要件である急迫性があったと考えられる。しかし、Y2が普段からナイフを携行していたことは、彼の不良性格を示すものである。また、Xが花瓶で殴りかかった際に、

User
続けて下さい

ChatGPT
Y2がナイフで反撃したことは、正当防衛の要件である相当性についても議論がある。ただし、Y1とY2が共謀してXを殺害しようとした証拠が不十分であることから、Y1を共犯として処罰することは困難であると裁判所は判断する。

証人Zの信憑性について
証人ZはY1とY2の会話内容や状況を把握していたが、警察に相談しなかった。その理由として、Y1やY2に危険が及ぶことを懸念していたからだと説明している。しかしながら、証人ZがY1とY2の会話を立ち聞きし、Y1がXの殺害を依頼している可能性があることを察していたにもかかわらず、警察に相談しなかったことは信憑性を疑わせる要素である。
総合的な判断
以上の理由から、裁判所は被告人Y1が殺人罪の共犯であるとは認められない。被告人Y1がXに対して憎悪の感情を持っていたことは事実であるが、具体的な殺害計画や共謀が確定的に立証されたわけではない。また、Y1がY2の行為に関与したとする証拠は不十分であり、Y2の行為が正当防衛である可能性もある。証人Zの信憑性にも疑問が残ることから、被告人Y1は無罪とする。
結論:
被告人Y1は、殺人罪の共犯とは認められないため、無罪とする。本判決は全員一致で下されるものである。

この文章のX、Y1、Y2、Zを元の人物名に置き換え、重複する記述を削る、語尾を統一する、などの修正を加えたものを実際の判決文としました。


4. 脚本について


ト書した脚本についてもこちらに公開します。

https://docs.google.com/document/d/1QR1V1Hi9r7WN9Q4bpJJDw21HZZ4NvTpROsJPc52qjRE/edit?usp=sharing

5.プロンプト意図について補足

プロンプトの作成意図について簡単に補足をします。

① 概要や証言を一度要約させたのはなぜか?

ChatGPTのトークン数の問題で、全ての証言を一括して記憶し、出力に反映することができないためです。

② 3人の裁判官による合議制を取ったのはなぜか?

合議制を取らない場合、最後に入力された弁論に過剰に引き摺られたためです。検察より裁判官、弁護側より裁判官の対決を通すことで、順番による印象の差を捨象し、論理の妥当性でのみ評価を下せるようにしました。

合議制を導入するにあたり、検察より/弁護よりの立場の裁判官を設けるのは、現実の「裁判官独立の原則」に反するのではないか、という懸念がありました。しかし、人間が公正中立を発揮できるシステムとGPTが公正中立を発揮できるシステムは異なっているという前提と、AIの導入により既存の司法システム事態もAIに合わせて変革されるという予想から、合議制を解禁しました。

6. プロンプト担当者について

プロンプトの作成は代表の岡本が行いました。出力された判決文へのフィードバックは企画全体で行いました。



文責:岡本隼一
A I裁判実行委員会

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?