マガジンのカバー画像

AI Memo

10
運営しているクリエイター

#LLM

1bit LLM の時代は来るのか,来ないのか,どっちなんだい?

1bit LLM の時代は来るのか,来ないのか,どっちなんだい?

徳永拓之(LeapMind(株))

1bit LLMの時代が来る? 2024 年2 月,The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits¹⁾ というタイトルの論文がarXiv上で公開され,にわかに話題となりました.“1.58 Bits” という表現はあまりなじみがありませんが,log₂(3) = 1.58 . .

もっとみる
【論文瞬読】LLMの新たな思考形式:自然言語を超えて

【論文瞬読】LLMの新たな思考形式:自然言語を超えて

あいさつこんにちは!株式会社AI Nestです。
昨今は生成AIの開発が盛んで注目されていますが、リスクや課題も浮き彫りになっています。グーグルは自社の画像生成AIの不具合を修正し、AIの品質管理体制を見直しています。これはAIの透明性と公正性を向上させていくためには重要であり、我々も意識したいところです。

さて本日はLLMを活用して、下記の論文を「瞬読」してきたのでそちらをご紹介します。

もっとみる
驚異の1ビットLLMを試す。果たして本当に学習できるのか?

驚異の1ビットLLMを試す。果たして本当に学習できるのか?

昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。

BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。

この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジ

もっとみる
Google Colab で LLaMA-Factory を試す

Google Colab で LLaMA-Factory を試す

「Google Colab」で「LLaMA-Factory」を試したので、まとめました。

1. LLaMA-Factory「LLaMA-Factory」は、WebUIによる簡単操作でLLMを学習できるLLMファインチューニングフレームワークです。

サポートするモデルは、次のとおりです。

サポートする学習法は、次のとおりです。

サポートするデータセットは、次のとおりです。

依存関係は、次の

もっとみる

化学者のための大規模言語モデル・ラボオートメーションのすすめ(草稿)


(23/12/25: 情報を追加したり、表現を少し変えたりしました)

あまり使う人いないと思いますが、本記事はCC BY 4.0ライセンスです。

本記事の趣旨筆者の最近のマイブームである表記の件について、日本語のわかりやすい解説記事を化学系の読者向けに書いてくださいと頼まれたので、頭の整理も兼ねて、下書きを記します。

間違いやフィードバックなどあれば、コメントをいただけると助かります。

もっとみる
エージェント型AIシステム構築の7つの原則: OpenAI『Practices for Governing Agentic AI』を読み解く

エージェント型AIシステム構築の7つの原則: OpenAI『Practices for Governing Agentic AI』を読み解く

本稿はLLM Advent Calendar 2023 19日目の記事です。

AIエージェントシステム構築のガイドラインについてOpenAIの研究者らが論じているホワイトペーパー『Practices for Governing Agentic AI』(2023年12月14日公開、以下ホワイトペーパー)の内容が非常に示唆に富むものだったので、本稿ではこの内容を読み解いていこうと思います。

注意事

もっとみる