見出し画像

ChatGPT o1プレビューはPHDレベルの物理学教科書の問題を解けるんか?

2,710 文字

OpenAIが最新のフラッグシップモデルo1をリリースしたんや。2024年9月12日の今日リリースされたんやけど、仕事中の休憩時間にそのことを知ってん。ウェブサイトに載ってた情報や動画を見てたら、このモデルはこれまでにない推論能力を持ってるらしいんや。
具体的にどないしてるんかはよう分からんけど、問題に答える前にじっくり考えるみたいやな。公式発表には「物理学、化学、生物学の難しいベンチマークタスクで、次のモデル更新はPHD学生と同等の成績を収めた」って書いてあったんや。数学やコーディングでも優秀らしくて、国際数学オリンピックの予選問題では、前のGPT-4が13%しか正解できへんかったのに、このモデルは83%も正解したらしいんや。
遺伝学や経済学、量子物理学、認知科学なんかの専門家が、このo1モデルの凄さを語る動画もあったんやで。
せやから、ちょっとええ考えが浮かんでん。物理学やら数学やらでPHDレベルの能力があるって言うんやったら、物理学の大学院生にとって最も悪名高い教科書に挑戦させてみたらどうやろ?ってな。
その教科書っちゅうんが、ジョン・デイビッド・ジャクソンの「古典電磁気学」や。物理学を高度に学んだ人やったら誰でも知ってる伝説的な本なんや。問題が難しいし、説明も不親切やし、もう物理学界では有名なミームになってもうてるんや。
「人生で必要なことは全部ジャクソンの電磁気学から学んだ」っていう有名な文書があるくらいや。その中の8番目に、ジャクソンの問題1問を解くのに平均1週間半かかるって書いてあるんやけど、それくらい難しいんや。
せやから、o1にジャクソンの問題で挑戦してみたいと思ってん。もしそんなに賢いんやったらな。この動画のために使うのを我慢してたんやけど、この伝説的な教科書の問題をどないするか見てみたいと思ってん。
ジャクソンの本から3つの問題を選んだんや。答えが分かってる問題ばっかりや。正解かどうか確認したいからな。ジャクソンの電磁気学を自分でやったんは何年も前やから、全部の計算を確認するんは無理やけど、この3つの問題で正解にたどり着けるかどうかを見てみたいんや。
最初の問題は2章か3章からのもんやと思うんやけど、こんな感じや。
「長い中空の導体円筒の内側の半径がBで、両側に小さな幅wの隙間があって、それぞれV1とV2の電位に保たれてる。内側の電位がこの式で表されることを示せ。」
これをそのままo1に入力してみるわ。画像は入力できへんから、全部文字で打ち込んだんや。さあ、どないなるか楽しみやな。
おっ、考えてるみたいやで。問題を設定して、解決策をマッピングして、対称性を考えて、境界条件を分析してる...全部ええ感じやな。フーリエ級数を使ってるみたいや。
おっと、アプローチを変えてるな。最初は間違えたみたいやけど、戻って修正してる。これは面白いわ。
おお!できたみたいや!2分ちょっとで解けたんや。人間やったら1週間半かかるのに、122秒で終わってもうた。物理の大学院生はもう泣いてええで。これは指数関数的な速さやで。
プロセスを見てみると、複数の方法を試してるみたいや。ラプラス方程式を立てて、円筒座標を使って...ほんまに人間の物理学者みたいやな。
次の問題も見てみよか。これは本の真ん中くらいの、磁気の章からや。もうちょっと難しいかもしれんな。
おっ、相互インダクタンスを計算し始めたで。完全楕円積分を使ってるみたいやな。
なんと!21秒で解いてもうた!これはもう信じられへんわ。大学院生のときにこれがあったらなぁ。
最後の問題は2つの部分に分かれてて、本の後ろの方の章からや。ここまで来たら本当に難しくなるはずやけど、さっきまでの様子を見てると、もう分からんなぁ。
おっ、散乱断面積の式を導出しようとしてるな。偏光因子のことも考えてるみたいや。ベッセル関数も出てきたで。
おいおい、「考え直してる」って言うてるで。どないして考え直してるんや?知識をどう保存して、行ったり来たりしてるんや?人間みたいやな。
あかん、できてもうた。最初の部分も2番目の部分も導出できてる。これはもう完璧やわ。
ほんま、3つのジャクソンの問題を5分以内で解いてもうた。大学院生が10日かかるような問題をや。
もう少し驚きが収まったら、全体的な感想を言うわ。まず、今見たことに対して文句を言うのは難しいな。もっとオープンエンドな問題を出すべきやったかもしれんけど、そしたら正確さを評価できへんからな。
説明と全ての過程を示してくれたのは素晴らしかったわ。教授が学生の答案を採点するんやったら、こんな努力を見たら喜ぶやろな。
OpenAIの主張、つまりPHDレベルの学生と同じくらいの能力があるっていうのは、もう疑う余地がないわ。これからどうなるんかは分からんけど、こんな能力のあるツールにもっと多くの人がアクセスできるようになるのは、すごくワクワクするな。
学生にとっては最高の勉強相手になるやろな。僕が20年以上学校におった時にこれがあったら、学びがめっちゃ加速したやろうなぁ。でも同時に、これは究極のカンニング道具にもなりかねんな。大学や高校がこれをどう防ぐんか、すごく気になるわ。
もっと大きな視点で見ると、これで職業がどんどん改善されて、効率が上がるんやろうな。新しい発見やイノベーションも増えるかもしれん。AIの金銭的な利益がまだ見えてこないって言われてるけど、少なくとも日常の退屈な仕事は革命的に変わるんちゃうかな。
コンピュータービジョンや自動運転、ロボット工学の分野でも、こんな推論能力があったらどんなことができるか想像してみ?すごいことになるで。
でも怖い面もあるな。こんな強力なツールやから、悪用される可能性もある。具体的には言わんけど、悪いことの詳細な設計図を作るのに使われる可能性もあるわけや。
使うのが楽しみやけど、怖くもあるな。これはまだプレビュー版やで。完全版はもっとすごいんやろ?ジャクソンの問題をこんなに簡単に解いてしまうんやから。
exciting(わくわくする)な時代やけど、scary(怖い)時代でもあるな。好きかどうかに関係なく、これらのものに慣れていかなあかんのやろうな。みんなもっと使い慣れた方がええと思うで。これからずっと一緒やからな。
もう十分しゃべったな。要するに、これには本当に驚いたってことや。5分でジャクソンの電磁気学ができるなんて信じられへんかったけど、やってのけたんや。
見てくれてありがとう。こんな動画がもっと見たいなら、いいねとコメントをしてチャンネル登録してな。また次回の動画で会おう!

この記事が気に入ったらサポートをしてみませんか?