見出し画像

よく聞くLLMって何?

お疲れ様です。小野さんです。トラックに乗りながらNFTとかAIの話をしております。本日はLLMについて話をしていきたいと思います。LLM、AIの調べ物をしているともうほとんど毎日と言ってもいいぐらいこの言葉にぶち当たるんですけど、僕全然意味知らなくて、調べてみたら、チャットGPTに搭載されているやつ、それぐらいの理解でも最初はいいのかなと思うんですけど、せっかく調べたのでざっくりなんですがまとめてみました。

LLMはラージ・ランゲージ・モデルという略だそうです。これを日本語で言うと大規模言語モデルというそうです。これ聞いたことあるんじゃないですかね。何に搭載されているかと言うと、チャットGPTとかGoogleのバード、そうですねチャット生成AIに搭載されていることが多いということです。

LLMはなんぞやというところなんですけど、大量のテキストデータを学習したAIモデル、トレーニングされたAIモデルという僕は解釈です。これちょっとまた難しい言葉なんですけど、自然言語処理NLP技術を駆使して人間のように言語を理解し生成する能力を持っているそうです。

ざっくりとしたLLMの仕組みなんですけど、本当ざっくり簡単に3つに分けるとすると、まず1つ目、データ収集と前処理。LLMのトレーニングには膨大の量のテキストデータが必要です。これらのデータは書籍、ウェブサイト、ニュース記事、フォーラムの投稿など様々なソースから収集されます。

2つ目、トランスフォーマーアーキテクチャー。ちょっとわけわかんないですね。これは基盤となる技術だそうです。トランスフォーマーは文中の単語やフレーズの関係性を理解するために、自己注意機構を利用します。要するに文脈を考慮した自然な言語生成が可能になっていますよという意味だと思います、多分。

3つ目、トレーニングプロセス。これはデータを使って事前にトレーニングされています。このプロセスでモデルが次に来る単語を予測するというタスクを繰り返すことで言語のパターンとか意味を学習して、トレーニングが完了した後は特定のタスクに応じて微調整ができるらしいです。

LLMの活用例なんですけど、もうすでに僕らがもう触っているAIとかには搭載されてたりはするんですが、それらチャットボットであったりとかカスタマーサービスで使われることが見込まれています。あとコンテンツ生成、そうですね、本だったりとかブログだったりとか記事だったりとか、多分得意とするところなんだと思います。

あと翻訳ですね。翻訳技術の進化にも寄与しており、異なる言語間での自動翻訳を行うことができる。グローバルを超えたコミュニケーションがスムーズに行えるようになります。

次、教育と学習支援。教育分野でもLLMは活用されています。例えば学生の質問に対するチュータリング、回答する人ですか、そういった役割を担ったり、オンライン学習プラットフォームでサポート、さらには個別学習の進捗管理など多様な形で教育を支援しています。

そんな便利なLLMなんですが、課題があるそうです。それはバイアスと公平性。たくさんの大量なデータを収集するので、例えば不適切な表現だったり言葉だったりを使っちゃうことがある。その問題を解決するためにももっとデータを多様化させたり公平性を確保する取り組みが必要です。

あと間違った回答とかもありますよね。僕もよくチャットGPT使うんですけど、元のソースと照らし合わせないと怖くて使えなくて、まだそういった課題がまだ残されてるそうです。

あと計算資源と環境への影響。ビットコインのマイニングと似てますかね。LLMのトレーニングは大量の計算資源が必要です。これに伴うエネルギー消費は環境への影響も大きい。持続可能なAI技術の開発が求められています。

安全性と倫理。LLMの出力が誤情報や有害な内容を含む可能性もあり、安全性と倫理の観点からの監視と規制が必要です。特に誤った情報が広まることで社会的な混乱を引き起こすリスクがあるため、慎重な運用が求められます。

LLM、そんな感じですね。情報が目まぐるしく進化して新しい言葉がどんどん出てくるんですけど、一緒に勉強していきましょう。

これ実はですね、この原稿をチャットGPTに作ってもらったんですよ。すごくないですか。LLMという言葉についてYouTube用に台本をまとめてくださいという指示出しました。で、結局なんですけど、さっきも言ったようにやっぱこの生成された説明文が正しいかどうかっていうのは自分の目で確認する必要があるっていうのがまだネックなんですけど。

余談なんですけど、この前ご紹介したチャットハブってやつ、同時進行で何個ものチャットAIを立ち上げられるっていう拡張機能あるんですよ。チャットGPT、ジェミニ、クロード、コーパイロットとか、例えば4つ立ち上げて質問は1つの質問なんすよ。だから僕がここに、LLMという言葉の説明についてYouTube用に台本まとめてくださいという1回の質問で4つのAIから返答もらえるんで、僕がさっき言った合ってるかどうかの照合もここの4つのAIを照らし合わせるだけで分かるんですよ。

4つ中3つがAって言ってるのに1個だけBって言ってたらBが怪しいじゃないですか。そういったところの検証がすごい捗るよっていう。完全に余談でした。ではでは。


いつも記事を読んでくださり、ありがとうございます。 皆さまのいいねや温かいコメントが、私の励みになっています。 これからも楽しんでいただける記事をお届けしていきますので、 今後ともよろしくお願いいたします!