論文解説まとめ

2024年2月7日 00:37

¥500

ポケモン対戦エージェント : POKE´LLMON

　こんにちはこんばんは、teftef です。今回は，ポケモンを LLM でプレイしてみたという論文です。ぱっと見た感じ見た感じよくある「エージェント」の論文ですが、ちょっと結果が面白かったので、メモ程度に書いていこうと思います。（主がポケモンをやっていたから気になるというのもあります。）
　私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひ

もっとみる

teftef

2023年5月27日 20:22

自律型マインクラフター (Minecraft played by AI)

　こんにちはこんばんは、teftef です。今回は AI がマインクラフト (Minecraft) をプレイするということに関してです。OpenAI が開発した Video PreTraining (VPT) 、強化学習を使用した MINEDOJO、GPT-4 を使用した Voyager という最新手法などを３つの異なるアプローチを紹介していきます。
　私もまだ初学者であり、説明が間違っていたり勘

もっとみる

teftef

2023年4月29日 23:45

DeepFloyd IF : 自然言語モデルの知識を利用した画像生成モデル (Imagen)

　こんにちはこんばんは、teftef です。2023 年 4 月 29 日に Stability AI に所属する開発チーム : DeepFloyd から Stable Diffusion とは異なる手法を使用した DeepFloyd IF が公開されました。このモデルは文字を破綻せずに生成できたり、高品質な画像を生成できるモデルとして注目を集めています。今回はこの DeepFloyd IF のベ

もっとみる

teftef

2023年4月25日 21:55

CLIP は赤い丸の意味を理解できるのか？新たな Prompt engineering の話

　こんにちはこんばんは、teftef です。私たち人間は、画像に赤い丸がついていると、無意識にその丸の中身が重要なものであると判断すると思います。果たしてそれは大規模視覚言語モデル (LLM) の CLIP も同じような挙動をするのでしょうか？
　今回は言語情報 (Prompt) の代わりに特定の視覚的情報を与えることでCLIPがその領域に注目できるかどうか、また視覚的情報が言語情報の代わりになる

もっとみる

フォローしませんか？

#自然言語処理

ポケモン対戦エージェント : POKE´LLMON

自律型マインクラフター (Minecraft played by AI)

DeepFloyd IF : 自然言語モデルの知識を利用した画像生成モデル (Imagen)

CLIP は赤い丸の意味を理解できるのか？新たな Prompt engineering の話