見出し画像

【ChatGPTに振り回されてませんか?】重要4ワードで人に説明できる理解をしましょう−167号−

(2023年5月2日メンバーシップ向け解説動画を議事化しております)

ChatGPT、人に説明できますか?重要4ワードで振り回されない理解をしましょうということで、解説をします。

5月もやっぱりChatGPTはめちゃくちゃ世の中で流行っているみたいです。ビジネス書でもChatGPTの使い方ランキングは3位とかに入ったりとか。あとは東洋経済さんとこの前にイベントやったんですけどChatGPT特集号は他の号に対しても売れるみたいな話があります。

ただやっぱり読んでみると、どうしても「ChatGPTにちゃんと入力をしないと」みたいなことに偏っていて、本当の技術の根幹みたいなところがきちんと解説されていないのです。
結果的に要は得意なことと苦手なことというのがちょっとわかりにくくなっているんじゃないかなと思うんですね。

この4つのワードですね。Transformer(トランスフォーマー)モデルというのとRLHF含めたアライメント。Chain of Thoat(チェーンオブソート)を含めたリーズニングとか今度オープンになっていくPlagin(プラグイン)とかこの4つのキーワードをしっかり理解していると、何ができて何ができにくいのか、いつくらいにどうなるのかみたいなことの予測がしやすくなります。それを技術最小限で解説していきたいと思います。

──────
LLMとは?
──────

ChatGPTは何かというと、文章を生成するためのラージランゲージモデル(LLM)。簡単にいうと、でかい大規模に言語を学習したモデルの一種です。やろうとしていることは何かというと、「こういう文章を作って」と言った時に正解に近い文章を作ってほしいということだから生成と言ったりするわけです。

んじゃ、具体的にこれ何やっているかというと、「次の単語は何の単語を入れるともっともらしいか」いうことを連続してやっているだけなんですよ。この単語に対して次の単語に何を入れたら「一番その正解に近くなるんだろう?」「もっともらしくなるんだろう?」ってのを入れているだけなんですね。

ただ例えば「謝罪文を作ってください」という話をお願いすると「謝罪文で何だっけ?」という、そもそもの「謝罪とは何か」という意図を読み解くことだったりとか
「この謝罪文を書くときには全体の構成どうしなきゃいけないんだっけ?」「1個1個中に入れるための丁寧な文章ってどう書くんだっけ?」「お詫びを示すことってどういうふうにしなきゃいけないんだっけ?」「この謝罪文の構造の中に理由と対策みたいなこと書かなきゃいけないと理由ってどういうふうなこと書かなきゃいけないっけ?」
というふうに、最もらしい文章を「次の単語を予測しようね」ということだけなんですね。

でも結果的にこういう概念というものを理解しないと次の単語が予測できないわけですね。だから人間というのは1個1個のことを知っているという知識の話と知識を組み合わせて全体を構成していく知性の話がある。
こういう概念操作をしていく知性というものが大量にラーニングして単に次の文章を当てていくだけで学んでしまったということなんですよ。

「なんでこういう概念操作が簡単に学べるようになっちゃったの?」というのがこのトランスフォーマーという技術です。
この概念を学ぶためには次の単語を伝える時に「全体構造から考えたらこういうこと考えなきゃいけないよな」「丁寧な言葉を書くにはこういうことを気をつけなきゃいけないよな」「お詫びってこういうような形容詞表現とかを気をつけなきゃいけないよな」という気をつけなきゃいけないポイントのことをアテンションという言い方をします。
これは次の単語を作る時に注意しながらやらないといけないかということを操作しやすいモデルがトランスフォーマーモデルです。

しかもこれはちょっとマニアックな話だった覚えなくてもいいんですけども、並列計算という今のGPUと本当に相性が良かった。この並列計算と相性がいいから本当に大規模な学習ができることでスーパー的にこの概念操作を理解してくれた。
かつ、知識を学んでいるだけではなくて知性である概念操作も学んでしまったので、大規模にしていくとGPTの3の時というのがアメリカの司法試験に受かんなかったのに、GPT4になっちゃったらアメリカの司法試験をトップ10%の結果で受かるみたいなところまで行ってしまったわけですね。

──────
RLHFとは?
──────

これはもうすごいじゃないですか! って話なんですけど、なんでGoogleとかBYDOとかFacebookとかいろんなところが出してきているのに対して、OpenAIのChatGPTがなんでこんなにユーザーにとってすごいの?
というところが最近このOpenAIの創始者の方々やっぱりインタビューでポッと話し始めているんですけど、それの重要性というのがこのRLHF、ないしはRLHFはやり方の種類の名前なのでアライメントと呼ばれる手法なんですね。

これは何かというと

<【初月無料】メンバーシップ開始しました!>
マガジンの内容を、最速で、より濃く、動画で分かりやすくも学べる「アフターデジタル時代の成長術DX」メンバーシップを開始しました。

Google, リクルート, McKinseyで新規事業・事業投資を歴任し「モチベーション革命」」「プロセスエコノミー」出版、NHK「令和ネット論」にて「DX」「メタバース・NFT」を解説している尾原による、
・【週3本】変化の時代に必要な成長論10分解説動画
・【週2本】過去配信分の10分解説動画議事録を公開
・【月1本】ゲスト対談動画UP(過去ゲスト動画50本以上も閲覧可能)
・【月1回】QA開催

をお楽しみいただけます!

ここから先は

4,086字

この記事が気に入ったらサポートをしてみませんか?