- 運営しているクリエイター
記事一覧
[スピンオフ]今更聞けない生成AI解説まとめ/Diffusionモデル入門①モデルの概要
前置きどうも、それなニキです。
流石にここ数回の投稿では自分の研究から逸れた雑談ばかりだったので、ここら辺で戻っていこうと思います。
さて、今回扱うのは、前回までのLLMとは打って変わってDiffusionモデルです。
そう、何を隠そうこのモデル、あのStable Diffusionに使われているシステムなのです!
なぜこのモデルについて扱うのかというと、大学の研究で少し関連分野をやることに
今更聞けないLLM解説まとめ⑤Fine Tuning
どうも、それなニキです。
今回も勉強を続けていきましょう。
いつものごとく、自分の思考まとめで読みにくいですがご了承ください。
また、最初からそうですが、基本的には松尾研のLLM Summer School 2023の内容を全面的に参照しています。
1.LLMにおけるFine-Tuningの位置づけまずはLLMを訓練していく上での流れを俯瞰してみましょう。
これまで扱ってきた「事前学習」は
今更聞けないLLM解説まとめ③事前学習
始めにどうも、それなニキです。
今回から本格的にLLMの仕組みを掘り下げていきます。
相も変わらず私の思考メモなので読みづらいですが悪しからず。
1.ニューラル言語モデルまずは、LLMを解説するうえで基礎となる言語モデル(LM)の構造から扱っていきます。
第一回でちらっと触れたと思いますが、言語モデルというもの自体はそれほど新しいものではなく、過去に様々なタイプが開発されてきています(n-
今更聞けないLLM解説まとめ①LLMって何ぞ
雑談どうも、それなニキです。
そろそろ卒論配属の時期が迫ってきており、気になっている研究室へ訪問して話を伺ったり、優先的に配属してもらえるよう自己PRをする機会が増えてきました。
かくいう私も生成AIのフレームワークを用いた物質・材料の研究開発に興味津々で、いくつか研究室を訪問しています。
(分かる人にはこれだけで具体的な研究室名が分かるかもしれません)
そこで、ここ半年ほど雑談ばかりしてい
プログラミングスクール with ChatGPT
どうも。金銭管理と予定管理をガバったために、夏のうちに2回実家に帰る必要ができて、そのための新幹線代が足りないそれなニキです。
塾講師のバイトの振り込みじゃ間に合わないのでイベントバイトで稼いできます。
さて、夏休みということで久々にAIと戯れております。
ここ数日はStable Diffusion WebUIをGoogle Colab上で動かして遊んでいました。
(サムネは実際に生成した画像で
久々にChatGPTを触ったら色々変わってた!
どうも、テストがようやく終わってアプリ開発に少しリソースを割けるようになったそれなニキです。
久々にChatGPTを触ったところ、使っていない間にUIが色々改善されていたようで、ちょっと便利になっていました。
生存確認を兼ねて所感をまとめます。
①"Continue Generating"ボタンいやーこれですよこれ。
これが一番感動しましたね。
ちょっと背景を説明すると、生成系AIの弱点の