マガジンのカバー画像

LLMマガジン

3
LLM(大規模言語モデル)に関する記事をまとめています。
運営しているクリエイター

記事一覧

Googleのオープンモデル Gemma の概要

Googleのオープンモデル Gemma の概要

以下の記事が面白かったので、簡単にまとめました。

1. Gemma「Gemma」は、「Gemini」と同じ技術を基に構築された、軽量で最先端のオープンモデルです。「Google DeepMind」と「Google」の他のチームによって開発された「Gemma」は、「Gemini」からインスピレーションを受けており、その名前はラテン語で「宝石」を意味するgemmaを反映しています。モデルの重み付けに

もっとみる
驚異の1ビットLLMを試す。果たして本当に学習できるのか?

驚異の1ビットLLMを試す。果たして本当に学習できるのか?

昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。

BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。

この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジ

もっとみる
大規模言語モデル、有料版はどれを使うべきか

大規模言語モデル、有料版はどれを使うべきか

この記事は、個人向けサービスに関する比較となります。企業向けは別のプランが用意されていることも多く、その価格体系なども異なりますのでご注意ください。

大規模言語モデル(LLM)を使用することにより、様々な言語処理を行ったり、また、書き換え、アイデア出しなど、いろいろな用途に使用することができます。

多くの企業が様々なLLMを公開しており、特に有料版を導入しようと考えている方は、選択に迷われる方

もっとみる