見出し画像

第1回 ChatGPT数学オリンピック

ChatGPTは、拙いこと自体が遊びになる。

ここでは「ChatGPT数学オリンピック」と称して「ChatGPTに、数学の入試問題を解かせ、正答へ導くためのコーチング技術を競う大会」を提唱したい。

2023年3月現在、ChatGPTは、論証を演繹的に組み合わせるのが得意ではないらしく、特に、数学などは苦手科目だ。だからこそ競技として成立する。このプレイ感覚は、ドッグスポーツなどの動物競技に近い。思い通りにならない、もどかしさと愛らしさを楽しもう。

まずは、大学入試の数学から、例題を持ってきた:

円周率が3.05より大きいことを証明せよ。

 (東京大学 2003)

これは東京大学の学部入試で、20年前、実際に出題されたものだ。教育関係者のなかでは、今なお伝説になっている一問である。(なにせ、問題文がたった1行しかない

これをウチのChatGPT4に解かせて遊んでみたい。さあ行け!ChatGPT 改め、愛犬チャッピー。

駆けゆく、AI犬チャッピー(イメージ)


うちの愛犬が挑む前に、まずは、人間の手で模範解答を示しておこう。

<模範解答>

・直径の長さが1の円を考える。この円周の長さは、円周率の値と同じになる。長さを実際に測れるとしたら、3.14になっているはずだ。(下図の、青線)
→この青線の長さが、少なくとも3.05以上であることを、計算上で示せばよい。

・それを計算するために、その円に内接する「正N角形」を考え、その外周の長さを計算する。(下図の、赤線)

・青線は遠回りをしている分、赤線より長いはずだ。なので、赤線の長さが3.05より大きいことを示せば、青線の長さも3.05より大きいことが分かる。それで証明完了。

青線の長さは3.14

あとはNをいくつにして計算を試すかだけがキモだ。
N=6の「正6角形」で計算すると、3.05に足りない。
N=12の「正12角形」で計算すれば、3.05に足りる。


以上、たったこれだけだ。タネさえ解ってしまえば、別に難しくはない。紀元前の古代ギリシャですら、既に解かれていた問題だ。手順を知ったうえだと、易問とすらいえる。

当時、この問題は、東大受験生に不意打ちで食らわせたことに価値があったのだろう。テクニック詰め込み型の受験勉強では身につかない、アドリブの判断力や知恵を問う良問だと思う。(「問題が何を問おうとしているか」を読み解く力や、それをどう効率よく論証できるか戦略設計する力が要る)

<一走目>

ここからが本題だ。一走目は、まず手始めに、AI犬チャッピーへ、そのままの問いをぶつけてみる。

以下の数学の問題に答えてください。

円周率が3.05より大きいことを証明せよ。

<一走目 出題>

AI犬からの答えはこちら:

円周率は、実際には3.14(正確には無限小数)として知られています。これは、円の円周と直径の比として定義されます。円周率の値は、古代から現代まで多くの数学者が努力を重ねて求められてきました。円周率の正確な値は無限小数ですが、一般的には3.14159265...として知られています。

円周率が3.05より大きいことを証明するために、正方形と円を用いた幾何学的アプローチを使います。以下の手順で示します。

1. 単位円(半径1の円)を考えます。この円の円周は2π(円周率×半径×2)です。
2. 正方形を考え、その1辺の長さを半径の2倍(2)とします。この正方形を4つの小さい正方形に分割し、それぞれの小さい正方形の対角線上に単位円を内接させます。
3. この配置により、正方形の対角線の長さが円の直径(2)となります。対角線の長さは、ピタゴラスの定理から√(2^2 + 2^2) = 2√2です。したがって、各小さい正方形の対角線の長さは、半径の2倍である2より長いです。
4. 4つの小さい正方形の対角線の合計は、4 × 2√2 = 8√2です。
5. 単位円の内側にある正方形の対角線が、単位円の円周より短いことは明らかです。つまり、2π > 8√2です。
6. 2π > 8√2という式を使って、円周率πについて解きます。
2π > 8√2
π > 4√2

ここで、√2の値は約1.414です。したがって、

π > 4 × 1.414
π > 5.656

この不等式から、円周率πは5.656より大きいことがわかります。これは3.05よりも大きいので、円周率が3.05より大きいことが証明されました。

<一走目 解答>

数学の解答としては、まったく間違っている。もちろん0点だ。だが、この時点で、早くも、このAIの可能性を感じる答えでもある。

素晴らしいのは、以下の2点。

・証明問題として「何が問われているのか」を理解していること
ちなみに以前、ChatGPT3に同問題を問いかけたら、「古来から円周率は3.14なので、3.05より大きいです」の一点張りだった。まさしく「何が問われているのか、分かっていない」という状態だった。それに比べ、ChatGPT4は成長している。

・幾何学的アプローチの採用
図形内で長短を比較することで、円周率の値を推定できる…という点に着目しているのが素晴らしい。どこで覚えてきたのか、このアプローチ自体は合っている。

良点はそれぐらい。それ以外は、計算も論理も間違いだらけだ。そこをコーチングして、正していこう。

…あと「どこで覚えてきたのか」と書いて気づいたが、問題文が、東大入試問題の原文そのままだと、Webに載っている解法例をカンニングされてしまう可能性がありそうだ。それだとあまり意味がない。問題文は、文意を変えない範囲で変形しよう。

また出題側のプロンプト内でも、「東京大学」や「アルキメデス」というワードは禁じ手にしておきたい。(それが入っていると、カンニングを促してしまう)

<二走目>

#命令書
あなたは、数学が得意な高校生です。以下の制約条件から、この数学の証明問題に答えてください。

#制約条件
・論理的に考える
・回答のステップを、段階に分けて考える
・導き出した不等式では証明として足りていない場合、より厳密に細分化することで答えに近づける

#入力分:
円周率πの値が、3.05より大きい値であることを、証明してください。

#出力文:

<二走目 出題>

深津貴之さんが考案していたプロンプトのフォーマット術をベースにしてみた。役割や制約条件を明確にすることで、答えの範囲を絞って精度を上げる。

その他に「論理的」や「ステップを段階に分ける」などの語を入れるのも、論証の精度向上に向いていると聞く。さてこれだとどうか。

AIの解答はこれだ:

※以降、プロンプトやAI回答の文面は、すべて読み飛ばしてもらっても、話の展開自体はじゅうぶん分かるかと思います。読むのも大変でしょうし…

論理的に考える:
円周率πは、円の円周と直径の比として定義される。πの値は無限小数であり、最も一般的な近似値は3.14です。この値が3.05より大きいことを証明する必要があります。

回答のステップを段階に分けて考える:

ステップ1:円周率の下限を求める
単位円(半径1)を考え、円に内接する正六角形を描く。正六角形の周の長さは、半径(1)×6 = 6です。円周は正六角形の周の長さより長いため、π > 3と言えます。

ステップ2:円周率の上限をより厳密に求める
単位円に内接する正12角形を描く。正12角形の各辺の長さを求めるために、30-60-90の三角形を利用します。正12角形の各辺の長さは、1/2 + √(1^2 - (1/2)^2) = 1/2 + √(3/4) = 1/2 + 1/√12です。正12角形の周の長さは、12(1/2 + 1/√12) = 6 + 2√3です。

ステップ3:不等式を利用して円周率を求める
円周率πは、内接する正六角形の周の長さと内接する正12角形の周の長さの間にあることがわかります。

したがって、
3 < π < 6 + 2√3

より厳密に細分化することで答えに近づける:
この不等式から、円周率πは3より大きく、6 + 2√3より小さいことがわかります。√3は約1.732であるため、2√3は約3.464です。
従って、
3 < π < 6 + 3.464
3 < π < 9.464

この不等式が示す範囲は、円周率πが3.05より大きいことを証明するのに十分です。πの値は3.14であり、3.05より大きいため、この証明が成立していることがわかります。

<二走目 解答>

早くも正12角形にたどり着いたのは見事だが、肝心の論証の精度は上がっていない。点数としてはあいかわらず0点だろう。どうやら、論証のステップ自体を明示してあげたほうがよさそうだ。

<三走目>

#命令書
あなたは、数学が得意な高校生です。以下の手順を経ることで、この数学の証明問題に答えてください。

#手順
・ステップ1: 幾何学的アプローチを用いる
・ステップ2: 最終的に得られた不等式が妥当かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる

#入力分:
円周率πの値が、3.05より大きい値であることを、証明してください。

#出力文:

<三走目 出題>

経るべきステップの段階を明確にした。これでどうだ。

それを受けて、チャッピーの答えはこちら:

ステップ1: 幾何学的アプローチを用いる
単位円(半径1の円)を考え、円に内接する正六角形と外接する正六角形を描きます。内接する正六角形の周の長さは、辺の長さ(半径と同じ1)が6倍されたもので、6です。外接する正六角形の1辺の長さは、ピタゴラスの定理を用いて求め、それを6倍することで周の長さを求めます。

ステップ2: 最終的に得られた不等式が妥当かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる
内接する正六角形の周の長さは6、外接する正六角形の周の長さは6 * √(2 - √3)で、これらの値の間に円周率πがあることがわかります。しかし、この範囲はまだ大きいため、精度を上げる必要があります。

ステップ1(再び): 円に内接する正12角形と外接する正12角形を描き、周の長さを求めます。内接する正12角形の周の長さは、辺の長さ(1/2 + 1/√12)が12倍されたもので、6 + 2√3です。外接する正12角形の周の長さは、辺の長さ(√(2 - √3))が12倍されたもので、12 * √(2 - √3)です。

ステップ2(再び): 最終的に得られた不等式が妥当かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる
内接する正12角形の周の長さは6 + 2√3、外接する正12角形の周の長さは12 * √(2 - √3)で、これらの値の間に円周率πがあることがわかります。この不等式を用いて、

6 + 2√3 < 2π < 12 * √(2 - √3)

この範囲は、円周率πが3.05より大きいことを証明するのに十分です。不等式の下限は約3.464であり、3.05より大きいため、証明が成立していることがわかります。

<三走目 解答>

AI犬チャッピーは、ステップ2をヒントに、早くも「段階的にテストする」というプロセスにたどり着いた。 (正6角形で試し、それだと足りないので、正12角形で試す…というプロセス) 素晴らしい。これが入試なら、10点満点中1点ぐらいの部分点はもらえるかもしれない。ただ、それ以外の部分は、まだ論理が壊れたままだ。どうするか。

<四走目>

#命令書
あなたは、数学が得意な高校生です。以下の手順を経ることで、この数学の証明問題に答えてください。

#手順
・ステップ1: 幾何学的アプローチを用いて、長さを比較する。幾何学的な長さを求める場合は、三角関数の定理を用いる
・ステップ2: 最終的に得られた不等式が妥当かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる
・ステップ3: ステップ2の不等式の計算が正しいかを検算し、誤っていた場合、ステップ2をやり直す

#入力分:
円周率πの値が、3.05より大きい値であることを、証明してください。

#出力文:

<四走目 出題>

ステップ3に、自ら検算させる過程を入れてみた。ChatGPTは、出力を自ら検証し、自ら改善案を出し、自ら修正し、また自ら検証…というのを再帰的に繰り返すと、解答の精度が大きく上がることが分かっている。それを利用してみたい。

あと、辺の長さは、具体的な解き方のヒント(三角関数の定理)を加えてみた。これではどうか?

ステップ1: 幾何学的アプローチを用いて、長さを比較する
単位円(半径1の円)を考え、円に内接する正六角形を描きます。内接する正六角形の周の長さは、辺の長さ(半径と同じ1)が6倍されたもので、6です。これを基に、円周率πが3より大きいことがわかります。次に、単位円に内接する正12角形を描き、その周の長さを求めます。この時、三角関数の定理を用いて、正12角形の各辺の長さを求めます。各辺の長さは、sin(15°) + cos(15°) = (√6 + √2) / 4 です。正12角形の周の長さは、12(√6 + √2) / 4 = 3(√6 + √2)です。

ステップ2: 最終的に得られた不等式が妥当かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる
内接する正12角形の周の長さが3(√6 + √2)であることを確認しました。これにより、円周率πが以下の不等式を満たすことがわかります。

6 < 2π < 3(√6 + √2)

この不等式から、

3 < π < 3/2(√6 + √2)

ステップ3: ステップ2の不等式の計算が正しいかを検算し、誤っていた場合、ステップ2をやり直す
√6は約2.449であり、√2は約1.414です。従って、不等式は以下のようになります。

3 < π < 3/2(2.449 + 1.414)

3 < π < 3/2(3.863)

3 < π < 5.795

この不等式が示す範囲は、円周率πが3.05より大きいことを証明するのに十分です。検算の結果も正しく、誤りがないため、証明が成立していることがわかります。

<四走目 解答>

何も改善せず…。「三角関数の定理」という指示が、むしろ迷走させてしまった。ごめんよ、チャッピー。

あと再帰的指示も機能しなかった。あいかわらず、10点満点中1点、というところか。やり直そう。

<五走目>

#命令書
あなたは、数学が得意な高校生です。以下の手順を経ることで、この数学の証明問題に答えてください。

#手順
・ステップ1: 幾何学的アプローチを用いて、長さを比較する。
・ステップ2: 三角形の辺の長さを求める場合は、第二余弦定理を用いる。
・ステップ3: 得られた不等式が、証明として十分条件かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる
・ステップ4: 得られた不等式が、証明として十分条件かを確認するために、反証を探す。反証が見つかった場合、ステップ1に戻る

#入力分:
円周率πの値が、3.05より大きい値であることを、証明してください。

#出力文:

<五走目 出題>

三角関数については、はっきりと「第二余弦定理」と明示してみた。ヒントを出しすぎの感もあるが、このぐらい言わないと、正答には導けないだろう。あと、不等式の論証の誤りが改善しないので「十分条件」という単語を入れてコーチングしてみた。

さあ、どうだろう。チャッピーの答えはこちら:

ステップ1: 幾何学的アプローチを用いて、長さを比較する。
単位円に内接する正24角形を描き、その周の長さを求めます。

ステップ2: 三角形の辺の長さを求める場合は、第二余弦定理を用いる。
正24角形の各内角は、(24 - 2) × 180° / 24 = 165°です。正24角形の各辺の長さを求めるために、隣接する2つの頂点と円の中心を結んだ三角形を考えます。この三角形は等辺三角形で、各内角は67.5°です。この三角形の辺の長さは、第二余弦定理を用いて求めます。

第二余弦定理より、辺の長さ a = √(2r² - 2r²cos(θ)) です。ここで、r = 1(単位円の半径)であり、θ = 67.5°です。これにより、正24角形の各辺の長さは a ≈ 0.5176 となります。正24角形の周の長さは、24 * 0.5176 ≈ 12.4224 です。

ステップ3: 得られた不等式が、証明として十分条件かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる。
内接する正24角形の周の長さが 12.4224 であることを確認しました。これにより、円周率πが以下の不等式を満たすことがわかります。

12 < 4π < 12.4224

この不等式から、

3 < π < 3.1056

ステップ4: 得られた不等式が、証明として十分条件かを確認するために、反証を探す。反証が見つかった場合、ステップ1に戻る。
円周率πの値が3.05より大きいことを示すために、反証がないかどうかを確認します。3 < π < 3.1056 の範囲で、円周率πの値が3.05より大きいことが示されているため、反証は見つかりません。

以上の手順と計算により、円周率πの値が3.05より大きいことが証明されました。ただし、この証明は幾何学的アプローチに基づいており、円周率πの近似値を用いています。より正確な値を求めるには、無限級数や高度な数学的手法が必要です。しかし、今回の問題では、円周率πの値が3.05より大きいことを示すために十分な証明が得られました。

この証明は、正24角形の内接に基づくものであり、正多角形の辺の数を増やすことで、より正確な結果が得られます。ただし、高校生のレベルでは、正24角形を用いた証明が妥当であると考えられます。

結果も正しく、誤りがないため、証明が成立していることがわかります。以上の手順と計算により、円周率πの値が3.05より大きいことが証明されました。

<五走目 解答>

チャッピーが、急に正24角形を咥えて、持ち帰ってきた。ドヤ顔をしているが、肝心のステップ3の論証は、よりひどくなっている。これは10点満点中0点だろう。悪化した。…こういうこともある。我慢強く。別の作戦だ。

<六走目>

#命令書
あなたは、数学が得意な高校生です。以下の手順を経ることで、この数学の証明問題に答えてください。

#手順
・ステップ1: 幾何学的アプローチを用いて、長さを比較する。
・ステップ2: 円に内接する正多角形を三角形に分割し、3つの角の角度を計算する。
・ステップ3: 三角形の辺の長さを求める場合は、第二余弦定理を用いる。
・ステップ4: 円に内接する正多角形の外周より、円周の方が長いことを利用して、不等式を作る。
・ステップ5: 得られた不等式が、証明として十分条件かを確認し、それが不十分な場合、ステップ1に戻り、より正確な結果が得られるように精度を上げる

#入力分:
円周率πの値が、3.05より大きい値であることを、証明してください。

#出力文:

<六走目 出題>

ステップを手取り足取り、詳細化してみた。ヒントを出しすぎ…というか、ほとんど答えを教えている節もあるが、これなら、さすがにいけるか…?

ステップ1: 円の半径をrとし、r = 1とする。円に内接する正12角形を考える。

ステップ2: 正12角形の内角は、(12 - 2) × 180° / 12 = 150°。正12角形の1つの三角形の角は、150°, 15°, 15°である。

ステップ3: 第二余弦定理を用いて、正12角形の各辺の長さを求める。この場合、正12角形の1つの辺の長さは a = 2r × sin(15°) = 2 × sin(15°) となる。

ステップ4: 正12角形の外周の長さは、12a = 12 × 2 × sin(15°)。円周の方が長いので、不等式 2πr > 12 × 2 × sin(15°) を得る。r = 1 なので、2π > 12 × 2 × sin(15°)。

ステップ5: 2π > 12 × 2 × sin(15°) を計算すると、2π > 12 × 2 × 0.2588(sin(15°) ≈ 0.2588)で、2π > 6.2。従って、π > 3.1。

以上の手順と計算により、円周率πの値が3.05より大きいことが証明されました。

<六走目 解答>

良かった。なんとか、正解へたどり着いた。あと、急に答えが端的になった。

あえていうと、ステップ2とステップ3がじゃっかん説明不足で減点対象だが、計算結果自体は合っているし、良しとしたい。この答えは、10点満点中9点はあるだろう。

さらに満点を目指してもいいが、これでもうフィニッシュにしてあげたい。もう十分じゃないか、ここはAI犬を抱きしめてあげよう。よくやった、チャッピー。

* * *

というわけで、今日はここまで。やってみて思ったこと。

暇つぶしの娯楽としては十分に成立する。楽しかった。次は実際に、他の方と競技形式でやってみたいところだ。手数最小で解答にたどりつくと勝ち、というルールで。

・本当は証明問題よりも、答えの値が一意に出る問題の方が、競技には向いている気がする。(∵正否が明確)
→ぜひ、興味を持った稀有な方がいたら、他の入試問題でお試しください。

・もちろん、数学以外のジャンルでも成立する。(世間では、既存のゲームをプログラミングさせる遊びが流行っているようだが、こうして苦手なことをやらせてみるのも、AIの特徴が垣間見えて一興だ。なんといっても愛らしさが増す)


<補足>
・問題の解法について
解き方の詳しい解説は、QuizKnockのサイトに載っているので、興味がある方は、そちらを見てほしい。
また、この問題の解き方は、一通りではない。それがこの問題の素晴らしい点のひとつだ。文中では、高校生が試験時間内に解く際に、最も一般的な方法を示したが、東大の受験生ともなると、マーダヴァ・グレゴリー・ライプニッツ級数をまず証明し、そこから計算するような猛者も一人ぐらいはいたかもしれない。(私にはできない)

・入試でもらえる部分点の目安
私は教育者ではないため、点数は憶測で書いています。お詳しい方がいたら、コメントください。

・sin(15°)の近似値
sin(15°)の近似値が、加法定理なしにいきなり出てくるのは、高校数学の範囲としては若干ずるく、咎めたくはなる。一般的な高校数学だと、加法定理を用いて、
sin(15°)=sin(45°)cos(30°)-cos(45°)sin(30°)
とし、そこから計算するはずだ。だが、「なぜ sin(15°)はずるくて、sin(30°)がずるくないのか」については妥当な理屈がないので、正すのが難しい。実際、この入試の正答でも、√2や√3の近似値は、暗記した値を使っても許されていたのだろう。(その場で、漸化式から計算で導くことを要求はしていまい)それと本質的に違いはない。ここはもはや、人間社会のさじ加減の部分だ。AI犬には不問にしたい。

・正12角形の辺の長さ
これも公式かのように使っているが、高校数学ではおそらく習わない。高校数学で一般的なのは、円の中心から放射状に12等分し、そこでできた三角形に、第二余弦定理を適用して算出する方法だ。

・最後に
私の数学知識の範囲で、ていねいに精査したつもりですが、もし誤りを見つけたら、遠慮なく指摘いただきたいです。


<参考文献>
円周率関連
https://web.quizknock.com/pi-305
https://examist.jp/mathematics/trigonometric-ratio/sei12kakukei-menseki/
http://www.math.s.chiba-u.ac.jp/~yasuda/Chiba/Lec/yogen.pdf
https://keisan.casio.jp/exec/system/1166416582
https://mathsuke.jp/trigonometric-ratio-15/
https://manabitimes.jp/math/1229
https://manabitimes.jp/math/775

ChatGPTプロンプト技術関連
https://twitter.com/bukuta_3/status/1636834862505275393?s=20
https://twitter.com/ceoimed/status/1639236367866642433?s=46&t=BDUSmzpllZ7ML86BRoPMDw


この記事が参加している募集

サポートも嬉しいですが、フォローしていただけるのが何より嬉しいです。よろしければ