AI Memo

2024年4月4日 16:14

1bit LLM の時代は来るのか，来ないのか，どっちなんだい？

徳永拓之（LeapMind（株））

1bit LLMの時代が来る？　2024 年2 月，The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits¹⁾ というタイトルの論文がarXiv上で公開され，にわかに話題となりました．“1.58 Bits” という表現はあまりなじみがありませんが，log₂(3) = 1.58 . .

もっとみる

AI Nest

2024年3月3日 18:54

【論文瞬読】LLMの新たな思考形式：自然言語を超えて

あいさつこんにちは！株式会社AI Nestです。
昨今は生成AIの開発が盛んで注目されていますが、リスクや課題も浮き彫りになっています。グーグルは自社の画像生成AIの不具合を修正し、AIの品質管理体制を見直しています。これはAIの透明性と公正性を向上させていくためには重要であり、我々も意識したいところです。

さて本日はLLMを活用して、下記の論文を「瞬読」してきたのでそちらをご紹介します。

ど

もっとみる

shi3z

2024年2月29日 02:19

驚異の1ビットLLMを試す。果たして本当に学習できるのか?

昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。

BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。

この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジ

もっとみる

寺田英雄（㈱オープンストリームCTO）

2024年2月29日 23:22

速報：話題の 1ビットLLMとは何か？

2024-02-27にarXiv公開され，昨日（2024-02-28）あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/ab

もっとみる

npaka

2024年1月2日 04:10

Google Colab で LLaMA-Factory を試す

「Google Colab」で「LLaMA-Factory」を試したので、まとめました。

1. LLaMA-Factory「LLaMA-Factory」は、WebUIによる簡単操作でLLMを学習できるLLMファインチューニングフレームワークです。

サポートするモデルは、次のとおりです。

サポートする学習法は、次のとおりです。

サポートするデータセットは、次のとおりです。

依存関係は、次の

もっとみる

Kan Hatakeyama

2023年12月23日 15:40

化学者のための大規模言語モデル・ラボオートメーションのすすめ(草稿)

(23/12/25: 情報を追加したり､表現を少し変えたりしました)

あまり使う人いないと思いますが､本記事はCC BY 4.0ライセンスです｡

本記事の趣旨筆者の最近のマイブームである表記の件について､日本語のわかりやすい解説記事を化学系の読者向けに書いてくださいと頼まれたので､頭の整理も兼ねて､下書きを記します｡

間違いやフィードバックなどあれば､コメントをいただけると助かります｡
ま

もっとみる

mah_lab / 西見公宏

2023年12月19日 08:00

エージェント型AIシステム構築の7つの原則： OpenAI『Practices for Governing Agentic AI』を読み解く

本稿はLLM Advent Calendar 2023 19日目の記事です。

AIエージェントシステム構築のガイドラインについてOpenAIの研究者らが論じているホワイトペーパー『Practices for Governing Agentic AI』（2023年12月14日公開、以下ホワイトペーパー）の内容が非常に示唆に富むものだったので、本稿ではこの内容を読み解いていこうと思います。

注意事

もっとみる

フォローしませんか？

#LLM

1bit LLM の時代は来るのか，来ないのか，どっちなんだい？

【論文瞬読】LLMの新たな思考形式：自然言語を超えて

驚異の1ビットLLMを試す。果たして本当に学習できるのか?

速報：話題の 1ビットLLMとは何か？

Google Colab で LLaMA-Factory を試す

化学者のための大規模言語モデル・ラボオートメーションのすすめ(草稿)

エージェント型AIシステム構築の7つの原則： OpenAI『Practices for Governing Agentic AI』を読み解く