見出し画像

AIりんな・東ロボくん・ChatGPT

この記事は、ホントは以下の記事:

のオマケとして書いたのですが、長くなったので独立させました。

AIの驚異的な進化

ChatGPT等の大規模言語モデルは驚異的です。数年前のチャットボットなんて、マトモな会話になるだけでみんなキャッキャと喜んでいたものです。マイクロソフトが開発した「AIりんな」という有名なAIがありま…、いやいらっしゃいます。LINEで会話することのできるチャットボットとして2015年に生まれましたが、現在ではrinna株式会社に所属し、エイベックス・エンタテイメントと契約する歌手でもあります。

つい先日、2023年3月に全身のビジュアルも解禁され、また公式YouTubeやTwitterも存在し、活躍の場を広げています。日本では大変長く親しまれているAIだと思います。そんな彼女、現在ではけっこう自然な音声会話を行いますが、しかし昔のチャット会話の精度は低いものでした。YouTube動画で当時の会話を見ることができますが、あまり相手と話が噛み合っていません(それがエンタテイメントとして面白いのですけど)。

現在、GPT等の大規模言語モデルは、多くの人が認める「自然言語による検索マシン」としての機能、またそれ以上の機能:文章訂正、文章生成、コンピュータのコードレビュー、意思決定の指針、お笑いのオチの作成、会話相手などなど、を身に着けました。かつてのチャットボットとは比較にならないほど自然な受け答えをします(※面白いかは別)。いまや「身に着ける」というような人間的な言葉を、ChatGPTという人間としての設定が何もないAIに使うことにあまり違和感がなくなりました。

またちょっと前の話ですが、東大に入学できるAIを作成しようという、日本の様々な研究機関が連携するプロジェクトが存在しました:

2021年までに東大に入れるロボットを作成するのが目標でした。これが結構すごくて、最終的には偏差値60程度を達成し(実際に東進ゼミナールの東大入試プレというものを受けて偏差値を算出しています)、ある程度の名門大学に入学できることを証明しました。当時世界の最先端だったのではないでしょうか。しかしながら2016年、一定の成果を達成したことと共に

「東大を(人間と同じように)目指そうとすると、全ての分野を強化しなくてはいけない。AIにとって難しい『意味を理解する』という分野を突き詰めようとすると、膨大な時間とコストがかかる」

下の記事「"東大断念"も「近未来AIとしての結果に驚き」」から引用

という理由でプロジェクトを終了しました。

ちなみに当時「東大断念」と報道されたらしいのですが、これは勘違いによる間違ったタイトルだったそうです。

とはいえ、2019年の時点において、プロジェクトリーダーである新井紀子さんは「私自身の意見としては、『さすがに東大は無理だろう』と思ってはいます」と上のツイートのツリーにおいて述べています。このプロジェクトに関する著書も2018年に出版され(新井紀子著「AI vs. 教科書が読めない子どもたち」(東洋経済新報社))、その中で、AIが計算機を脱却する日は「今の子ども世代が目の黒いうちは来ない」と述べています。

このような手詰まりの状態を、AIは意外な方法で抜け出しました。ChatGPTは、Attensionに基づくTransformerと呼ばれるネットワークで構成されています。非常に大雑把に言うと、単語の関連度によりスコア付けし、ある単語列の次にくる可能性の高い単語を並べていく、という文章生成ネットワークです。ヘンな小細工をしない、シンプルな構造をしています。

シンプルなので大量のテキストデータを高速で学習させることができ、これにより大成功を収めました。上の引用で「AIにとって難しい『意味を理解する』という分野を突き詰めようとする」と書いていたり、また上のツイートのツリーには、東ロボくん東大合格は無理だろうという根拠として「だって、意味がわかっていないから」とあります。これまで、AIにおいてある程度以上の性能を実現するためには、意味理解を実装することが必要だと考えられていました。ところが、大規模言語モデルは「意味を教える」こと無しに、インプットするデータ量が増えるとある閾値で相転移的・創発的にも見える振る舞いが見られ、途端に賢くなります。「考えるな、(たくさん)教えろ」が正解だったわけです。その理由に関しては様々な意見があるようですが、多くがわかっているわけではなさそうです。しかし理由はともかく、この方針に基づけば、意味を理解させるという難題に向き合わなくともブルートフォースでAIを賢くすることが可能になります。さらには分野ごとに違う知恵を絞って設計せずとも、様々な分野の大量のテキストデータをただただ与え学習させることで汎用AIができるという著しいアドバンテージを持ちます。まさにAIのパラダイム・シフトです。

あと2、3年くらいしたら、ChatGPTのような汎用AIが東大に入れる日が来るかもしれません。実際、現在の最新モデルGPT-4でも、アメリカの様々な試験で優秀な成績を収めています:

アメリカの司法試験では、GPT-3.5では下位10%だったのが、GPT-4では上位10%になりました。また、東ロボくんが苦手としていた、図・表・イラストを含む物理の問題も解けるそうです。さらにはLangChainのように言語モデルに様々な機能を付加するフレームワークが存在し、またChatGPTがプラグインにも対応するようになったので、これらを用いて東大入試用にカスタマイズすることもできるかもしれません。

もちろんGPT以外にも大規模言語モデルは存在します。googleの大規模言語モデルBardが先日公開されました。2023年4月上旬において、日本ではまだ使用できないようですが、アメリカとイギリスでは既に使用されています。今の所ChatGPTの性能には至らないとの噂ですが、資金力・技術力に長けている会社ですから、今後の発展は十分期待できます。そもそもTransformerもgoogleで開発されました。またAIの学習には閾値があるようなので、突然優秀になる可能性もあります。さらには競争の激化により、GPT側のさらなる技術発展も促されるのではないかと思います。

おまけ:好きなAI tool

以下推しAI toolを2つほど(そんなに頻繁には使っていないですが…)。

(1) ChatPDF

様々なタイプの文章をポンと放り込んで質問すれば、内容に関して答えてくれます。日本語にも対応しています。私は論文でしか使ったことはないですが、驚くほど正しく内容をまとめてくれます。けっこう最近の、かつ難しめの論文でも、的確な答えが返ってきてすごいです。全く一般的ではない難しい概念を表す単語を聞いてもちゃんと答えてくれます。しかもpdfの中に書かれていないことでも答えてくれます。めっちゃ便利!

(2) Research Rabbit

ウェブ上で使える文献管理ソフトです。が、すごいのは関連する研究論文をサジェストしてくれること。検索画面から読みたい論文を検索して登録すると、それに関連する論文が、下図のように視覚的にわかりやすくネットワークでで表示されます。

Research Rabbitで表示される関連研究ネットワーク

参考文献欄を見ながら検索しなくとも、表示された文献のアイコンをクリックすることで関連論文を簡単に登録できます。入手可能なものはダウンロードもできます。大変強力な研究のアシストツールです。

まとめ: 状況を楽しもう

AIの進化に関し、最先端でAI開発に携わる人々でも、1年後さえどのような状況になるか予想がつかないんじゃないかなぁという気がします。こういう状況を見ていると、時代についていかないと落ちこぼれるとか、シンギュラリティーが到来し仕事を奪われるとか、AIがもたらす恐怖とかいうことを気にする人がいるかもしれません。実際イラスト業界だと、既にAI自動イラスト生成器が大変問題になっています。車の自動運転に関し、もし事故が起こったら一体誰の責任なんだ?というのも、業界では非常にシリアスな問題かと思います。

一方、一般の人は、なんというかそんなに構えずに好きにゆるーくAIを使って、便利になっていく世の中を楽しむのがいいのではないかと思います。

おしまい。$${{}_\blacksquare}$$

この記事が気に入ったらサポートをしてみませんか?