この動画ではAIの言語モデル「CLIN」について紹介しています。CLINは自己学習・適応能力があり、未経験のタスクでも対応可能なゼロショットパフォーマンスを持ちます。独自のグローバルメモリとローカルメモリを用い、長期と短期の情報を効果的に利用します。一方、人間の学習は感情や社会的要素を含むが、AIは情報量の多い学習が得意です。CLINのメモリシステムと学習方法を理解することで、AIと人間の学習の違いと価値を把握できます。
公開日:2023年10月28日
※動画を再生してから読むのがオススメです。
言語モデルはいつか実際に人間を凌駕することができるのだろうか?
この疑問は、AI学習におけるCLINの進歩によって、より適切なものになりつつある。
CLINはAIにおける画期的な言語モデルであり、常に学習し、新しいタスクや環境に適応していく。
これは、余分な調整を必要とせずに相互作用やフィードバックから学習することができる、純粋なゼロショット設定のおかげである。
CLINが傑出している理由を詳しく見てみよう。
その仕組みと、なぜそれが人工知能における重要な進歩なのかを説明しよう。
まず、CLINとは何か、その機能を理解しよう。
CLINとは、Continually Learning from Interactionsの略で、言語エージェントが繰り返し経験することで、自分たちのすることが素早く上手になるように設計されたシステムです。
言語エージェントとは基本的に、テキストや音声など、私たちが理解できる方法で外界とコミュニケーションするコンピューター・プログラムのことだ。
これは、人と会話をするチャットボットや、あなたの指示に従うビデオゲームのキャラクター、あるいはコンピューター・コードを書くツールなどを意味する。
CLINのような言語エージェントは、常に監視したり再教育したりすることなく、複雑で変化し続ける世界に適応できるため、実際に必要なのだ。
あなたのフィードバックから学習し、より良いアシストをしてくれるパーソナルアシスタント、あなたのプレイスタイルに基づいて進化するゲームキャラクター、あるいはあなたの修正によってより効率的になるコードジェネレーターを想像してみてほしい。
それがCLINの目標だ。
研究者たちは、CLINがどの程度機能するかを確認するために、エージェントが自然言語を使ってオブジェクトと対話し、植物を育てたりアイスクリームを作ったりするような科学関連のタスクを完了する仮想環境、サイエンス・ワールドを使用した。
これは、CLINがダイナミックなシナリオの中で学習し適応する能力をテストするものである。
サイエンス・ワールドは言語エージェントにとって容易な環境ではない。科学的知識と推論スキルの両方が要求されるからだ。
さらに、Science Worldは、課題や環境によって難易度が異なります。
タスクは短いものと長いものの2種類に分けられる。
短いタスクは、水を沸騰させたり、質量を測定したりするような単純明快なものである。
長いタスクは、植物を育てたりアイスクリームを作ったりするような、複雑で複数のステップを要するものです。
環境も、キッチンや庭のような見慣れたものから、砂漠や火山のような見慣れないものまで、変化に富んでいる。
CLINがサイエンス・ワールドで優れているのは、その多用途性とさまざまなシナリオへの適応力だ。
特定の環境内でタスクを学習することも、さまざまな環境やタスクにまたがって知識を伝達することも、さらには適応と汎化の両方を兼ね備えた状況に対応することも得意だ。
まず、CLINの適応能力は素晴らしい。
特定の環境で経験から学び、時間とともにより効率的になります。
例えば、お湯を沸かすことを学習する際、コンロのスイッチを入れ、沸騰する過程を監視するなど、手順を理解し、アプローチを洗練させていく。
さらに驚くべきことに、CLINは学習したスキルを新たな環境や作業に応用することができる。
例えば、キッチンでお湯を沸かすことをマスターすれば、その知識を砂漠で別の道具を使って使うことができる。
同様に、庭で植物を育てることを学べば、火山で異なる資源を使って植物を育てることができる。
最後に、CLINの最も顕著な能力は、一般化と適応の両方を必要とするシナリオにおいて発揮される。
幅広い経験を活かして、まったく新しい仕事や環境に素早く適応する。
例えば、様々な環境でお湯を沸かす方法や、異なる環境で植物を育てる方法を知っていれば、これらのスキルを組み合わせて宇宙船でお茶を淹れることができる。
ゼロ・ショット・パフォーマンスと呼ばれる、これまでに遭遇したことのないタスクを実行するこの能力は、CLINを高度な言語モデルとして際立たせている。
CLINは言語エージェントの中でも際立っており、特に同じScience Worldで動作するReflectionのようなモデルと比較した場合、際立っている。
Reflectionは、フィードバックを分析し、その反射テキストをエピソードメモリバッファに保持することができるので、実際に印象的です。
しかし、リフレクションの適応性は特定の環境に限られており、さまざまなタスクに苦戦している。
一方、CLINはリフレクションだけでなく、強化学習や模倣学習に頼ったモデルも凌駕している。
これらのモデルは、多くの訓練データと詳細な調整を必要とすることが多い。
しかしCLINは、こうした更新や調整を一切必要とせず、効率性と適応性を両立させている。
CLINはいくつかの重要な分野で優れている。
たとえば、複雑で多段階の長いタスクの処理に優れており、約 85% の精度を達成しています。
これは Reflection の 62% を大きく上回り、CLIN がより負荷の高いタスクを処理できることを示しています。
さまざまな環境への適応においても CLIN は高い能力を発揮し、約 79% の精度を維持し、Reflection の 54% を大幅に上回りました。この柔軟性は、新しく異なる環境でも、より効果的にスキルを適用できることを意味する。
さらに、新しくユニークなタスクに取り組む場合、CLINの経験から学ぶ能力は明らかです。
このようなシナリオでの成功率は73%で、46%のリフレクションを上回っている。この適応力は、他のモデルと比較してCLINの高度な学習能力と応用能力を際立たせています。
CLINは目覚ましい成果を上げているが、その成功はメモリの革新的な使い方によるところが大きい。
CLINがどのように学習しているのかを見るのは興味深い。
CLINは2つの異なる記憶システムを使っている: グローバル記憶とローカル記憶だ。
グローバル・メモリーはより長期的で動的なものだ。
過去の経験からの因果的抽象化と呼ばれるものを保持している。
これは基本的に、ある行動がどのようにして特定の結果につながるかを説明するものである。
例えば、水を沸騰させるには熱が必要であるとか、植物は水と日光で育つといったことは、因果関係の抽象化の一種である。
このグローバル記憶は、それぞれの経験から得られる新しい関連情報で絶えず更新される。
対照的に、ローカル記憶はより短期的で、目の前の特定のタスクに集中する。
現在の活動からのフィードバックが記録され、CLINがどのように活動しているか、あるいは目の前の環境で何が起こっているかについての洞察を与える。
CLINがお湯を沸かそうとしている場合、お湯が沸いたというようなフィードバックがここに保存される。
あるいは、植物の世話をしているのであれば、植物が枯れていないかどうかを記録する。
このローカル・メモリーはリセットされ、新しいタスクのたびに新鮮なフィードバックで更新される。
さて、CLINはこれらの記憶をどのように使うのだろうか?
タスクに取り組む前に、CLINはグローバル・メモリーを参照し、役に立つ因果関係を抽象化する。
例えば、CLINが砂漠で水を沸騰させることに直面したとする。
CLINはグローバル記憶から、水を沸騰させるには熱が必要であることを思い出す。
これは、その環境で熱を発生させる方法を考えるなど、戦略を立てるのに役立つ。
火山の近くで植物を育てるという課題であれば、植物には水と日光が必要であることをグローバル記憶から思い出し、水を探したり、植物を極限状態から遮ったりする行動を導く。
タスクの間、CLINはローカルメモリーもチェックする。
これは、リアルタイムのフィードバックに基づいて行動を調整するのに役立つ。
お湯を沸かしているときに、ローカルメモリーからお湯がすでに沸騰していることに気づけば、沸騰を止めることができる。
あるいは、植物を管理しているときに、フィードバックから植物が枯れていることに気づけば、植物を涼しい場所に移動させるなど、アプローチを変えるかもしれない。
この二重の記憶システムが、CLINを際立たせている。
抽象的な概念から学ぶだけでなく、即座に実践的なフィードバックも取り入れる。
このアプローチにより、様々なタスクや環境に学習を適応させることができ、継続的に学習する言語エージェントの本質を体現している。
さて、CLINの学習方法を私たち人間の学習方法と比較して理解することで、両者の違いと共通点の両方が見えてくる。
人間もCLINも経験から学ぶが、私たち人間は感情や思考、社会的相互作用も織り交ぜることで、学習に深みを与えている。
私たちの学習は多くの要因によって形成されるため、豊かで詳細なものとなるが、時には予測不可能なこともある。
しかしCLINは、決められたアルゴリズムで学習する。
効率的であることに重点を置き、多くの情報を扱うことができるが、感情的な理解はない。
つまり、CLINの学習は非常に正確だが、人間のように感情を理解したり、倫理的な選択をすることはできない。
もう一つの大きな違いは、人間は異なる状況で最も効果的な学び方に合わせて学び方を変えることができることです。
このような適応性は、CLINのアルゴリズムベースの学習プロセスや、どのAIの学習プロセスにも見られないものだ。
こうした違いを理解することは、CLINがデータや情報を使ってできることを評価するのに役立つが、同時に人間の知性、特に感情を理解し道徳的な判断を下すことに関して特別な価値があることを教えてくれる。
この比較は、人間の学習とAIの学習が、それぞれの長所と短所を持ちながら、互いに補い合うことができることを強調している。
CLINの記憶システムがどのように機能するのか、その一端が明らかになれば幸いである。
もし質問や感想があれば、遠慮なくコメント欄に書き込んでほしい。
また、CLINについてもっと詳しく知りたい方のために、オリジナルの研究論文をビデオの説明文に掲載しています。
お聞きいただきありがとうございます。次回もお会いしましょう。