GenerativeAI

2023年7月3日 09:05

生成AI活用の試行錯誤〜Ubie社での取り組み〜

生成AIChatGPTをはじめとするGenerativeAI(生成AI)は、テレビや新聞で見ない日はないくらいに話題になっています。YouTubeでも芸人さんがChatGPTを紹介する動画が多数出ています。（個人的に、芸人かまいたちの「ChatGPTに漫才を作ってもらう」という動画が好きです。）

企業でも、ソフトバンクやNTTなどの大企業が、会社を上げて生成AIの開発・活用をしていくと発表してい

もっとみる

npaka

2023年8月28日 15:15

LLMのファインチューニングで何ができて何ができないのか

LLMのファインチューニングで何ができて、何ができないのかまとめました。

1. LLMのファインチューニングLLMのファインチューニングの目的は、「特定のアプリケーションのニーズとデータに基づいて、モデルの出力の品質を向上させること」にあります。

OpenAIのドキュメントには、次のように記述されています。

しかし実際には、それよりもかなり複雑です。

LLMには「大量のデータを投げれば自動

もっとみる

shi3z

2023年9月22日 14:26

無料でGPT4越え!?ついに来たXwin-LM

今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。

大先生もまだ試してないというので番組内で一緒に試してみた。
もちろんドスパラ製Memeplexマシン(A6000x2)を使用。

>>> from transformers import AutoToken

もっとみる

npaka

2023年4月3日 15:37

LLM のデータセットまとめ

LLMのデータセットをまとめました。

1. 事前学習データセット1-1. Text

1-2. Code

2. SFTデータセット2-1. Instruction

2-2. Code Instruction

2-3. Chat

3. Preferenceデータセット4. タスク別データセット4-1. マルチモーダル

4-2. キャラクター対話

4-3. AITuber特化型質問応答

もっとみる

npaka

2023年6月18日 08:37

Rinna 3.6B の量子化とメモリ消費量

「Google Colabでの「Rinna 3.6B」の量子化とメモリ消費量を調べてみました。

1. 量子化とメモリ消費量「量子化」は、LLMのメモリ消費量を削減するための手法の1つです。通常、メモリ使用量が削減のトレードオフとして、LLMの精度が低下します。

AutoTokenizer.from_pretrained()の以下のパラメータを調整します。

2. Colabでの確認Colabで

もっとみる

フォローしませんか？

#大規模言語モデル

生成AI活用の試行錯誤〜Ubie社での取り組み〜

LLMのファインチューニングで何ができて何ができないのか

無料でGPT4越え!?ついに来たXwin-LM

LLM のデータセットまとめ

Rinna 3.6B の量子化とメモリ消費量

GenerativeAI

フォローしませんか？

#大規模言語モデル

生成AI活用の試行錯誤〜Ubie社での取り組み〜

LLMのファインチューニング で 何ができて 何ができないのか

無料でGPT4越え!?ついに来たXwin-LM

LLM のデータセットまとめ

Rinna 3.6B の量子化とメモリ消費量

LLMのファインチューニングで何ができて何ができないのか