Baku

AIアニメ

Baku

27本

AI画像生成＋AI音声合成によるショートアニメの試作
ローカルLLM

Baku

28本

ローカルLLM関連は主にブログで更新しています。 https://sc-bakushu.hatenablog.com/

【AIアニメ】ComfyUIとSunoでシンプルなアニメMVをつくる

最近、音楽生成AIサービスのレベルが大きく上がっているようです。半年ほど前に話題になった「Suno」と後発の「Udio」が機能を競い合っていて、生成の質も使い勝手も大幅に改善しています。今回Sunoのv3.5で遊んだので、例によってComfyUIで生成した動画素材と楽曲を合わせてMV風のシンプルなアニメにしてみました。この記事はその作業メモです。 Suno(v3.5)で楽曲を生成する以前は1曲まるごとの生成はできず、楽曲の延長機能も使いこなすのがやや難しい？印象

【AI動画生成】ComfyUIでポカリスエットCM風の動画をつくる

生成AI用の画像/映像作成ツール「ComfyUI」とその拡張機能の「ComfyUI-AnimateDiff-Evolved」を使って、CM風のショート動画を作ってみたので、その時の反省メモです。実写系の動画生成もちゃんと試しておこうと思い、一昔前のポカリスエットのCMのイメージで30秒程度の動画を作ってみました。カット1：砂浜にとめた自転車冒頭のカットは、自転車の写ったフリー画像をお借りして、ControlNetで線画を抽出。線画からオーソドックスに画像生成しまし

Baku

2か月前

36
饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました

最近LLMコミュニティから生まれた小型MoEモデル「LightChatAssistant-2x7B」の日本語チャット性能がとても良いため、モデル作者さんが用いた手法（Chat Vector+MoEマージ）を後追いで勝手に検証しています。その過程で複数のモデルを試作したところ、7Bクラスとしてはベンチマークスコアがやたら高いモデルが出てきたので「Japanese-Starling-ChatV-7B」として公開してみました。以下はこのモデルの簡単な説明です。簡易評価

Baku

3か月前

102
【ローカルLLM】言語モデルの知識編集を試す（Knowledge Editing）

言語モデルの研究領域の一つに「知識編集(Knowledge Editing)」というものがあるらしい。近年は言語モデルの大規模化による開発コスト膨張が問題になっており、既存モデルをより長く利用するための低コストな知識更新手法に注目が集まってる（らしい）。とはいえ既存の知識編集手法は不確実性が高いうえ、モデル性能が劣化する副作用も存在する（らしい。こちらやこちらのアブストラクトを参照）。言語モデルの知識編集そもそも知識編集ってなんなのか、と思って検索したところ、

Baku

7か月前

29

【AIアニメ】ComfyUIとSunoでシンプルなアニメMVをつくる

117

Baku

1か月前

【AI動画生成】ComfyUIでポカリスエットCM風の動画をつくる

36

Baku

2か月前
饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました

102

Baku

3か月前
【ローカルLLM】言語モデルの知識編集を試す（Knowledge Editing）

29

Baku

7か月前

マガジン

AIアニメ

27本
ローカルLLM

28本

記事

【llama.cpp】CPUとRAM、どっちが重要？

llama.cppのCPUオンリーの推論について CPUでもテキスト生成自体は意外にスムーズ。なのに、最初にコンテキストを読み込むのがGPUと比べて遅いのが気になる。ちょっと調べたところ、以下のポストが非常に詳しかった。 CPUにおけるLLama.cppの高速化（超抄訳）「CPU推論のボトルネックはCPUじゃなくてメモリの性能」と聞くものの、最初のプロンプト処理の速さはCPU次第らしい。 GPUと差がつきやすいのはこっち。メモリに余裕があるなら読み込んだままにし

Baku

7か月前

7
【llama.cpp】CPUとRAM、どっちが重要？

7

Baku

7か月前
【ローカルLLM】Mixtral-8x7bをllama.cppで試す

2023/12/12：llama.cppで「Mixtral-8x7b」のGGUF量子化モデルを試しました（現時点でまだmergeされていないのでbranchを利用）。「Mixtral-8x7b」はMistralがリリースしたMoE（Mixture of Experts）構造のLLMです。英語＋欧州主要言語に対応しており、それらの言語でのベンチマークスコアはGPT-3.5＆Llama-2-70Bに匹敵ないし上回ります。 Mistralと同様に日本語性能は微妙なようです

Baku

7か月前

18
【ローカルLLM】Mixtral-8x7bをllama.cppで試す

18

Baku

7か月前
【llama.cpp】Qwen-14BをGGUF量子化して日本語で試す

2023/12/05：llama.cppが「Qwen」に対応したので試しました。「Qwen」は中国Alibabaグループが手掛ける大規模言語モデルシリーズで、テキストモデルは1.8B/7B/14B/72Bがあります。英/中メインの多言語モデルで、日本語性能も同サイズのLlama-2/Mistralに比べれば高いっぽいです。 QwenをGGMLで量子化・推論するための「qwen.cpp」が以前からあり、これが今回llama.cpp本家にマージされたとのこと。今回は

Baku

7か月前

7
【llama.cpp】Qwen-14BをGGUF量子化して日本語で試す

7

Baku

7か月前
【AIアニメ】ComfyUIではじめるStable Video Diffusion

11月21日にStabilityAIの動画生成モデル「Stable Video Diffusion (Stable Video)」が公開されています。これによりGen-2やPikaなどクローズドな動画生成サービスが中心だったimage2video（画像からの動画生成）が手軽に試せるようになりました。このnoteでは「ComfyUI」を利用したStable Videoの使い方を簡単にまとめまてみました。 1. Stable Videoについて今回StabilityAI

Baku

7か月前

64
【AIアニメ】ComfyUIではじめるStable Video Diffusion

64

Baku

7か月前
AnimateDiffでドット絵アニメをつくる / Pixel Art with AnimateDiff

AnimateDiffでドット絵アニメを作ってみたらハマったので、ワークフローをまとめてみました。 ComfyUI AnimateDiffの基本的な使い方から知りたい方は、こちらをご参照ください。 1. カスタムノード特別なカスタムノードはありません。以下の2つだけ使います。 https://github.com/Kosinkadink/ComfyUI-AnimateDiff-Evolved https://github.com/Kosinkadink/ComfyUI-V

Baku

8か月前

61
AnimateDiffでドット絵アニメをつくる / Pixel Art with AnimateDiff

61

Baku

8か月前
ComfyUI AnimateDiff + LCM-LoRAによる高速な動画生成を試す

StableDiffusionを高速化するLCM-LoRAを応用したAnimateDiffワークフローが話題になっていたので、さっそく試してみました。 LCM-Loraを使うと8以下のStep数で生成できるため、一般的なワークフローに比べて生成時間を大幅に短縮できるようです。ワークフローComfyUI AnimateDiffの基本的な使い方から知りたい方は、こちらをご参照ください。今回試したワークフローは以下になります。【GoogleColab Pro/Pro+

Baku

8か月前

42
ComfyUI AnimateDiff + LCM-LoRAによる高速な動画生成を試す

42

Baku

8か月前
【AIアニメ】AnimateDiffでアニメが作れるか？(2)

前回の記事のつづきで、AnimateDiffをつかった短い「アニメ」を試作しています。一部の場面ではキャラにリップシンク（口パク）をさせたいので、動画と並行して声（セリフ）の生成にも手をつけます。カット「もう11月だよ」「ちょっと前まであんな暑かったのに…」と言う姉（りりこ）に対して、妹（みいこ）が返答する場面です。カット２と同じくモデルは「Counterfeit-V3.0」で、オーソドックスに生成しています。構図はControlNetで緩く指定しました。

Baku

8か月前

14
【AIアニメ】AnimateDiffでアニメが作れるか？(2)

14

Baku

8か月前
GPT 3.5-turboが20Bパラメータという話の後日談

TL;DR　論文著者によれば「論文に書いたパラメータ数の出所はForbesの記事であり、その記事にソースの記載はない」とのこと。 10月26日にarxivに掲載された論文で、GPT 3.5-turboのパラメータ数が200億（20B）という記載があり、数日前に話題になった。論文著者が（OpenAIと提携している）Microsoftの研究者だったこともありバズったものらしい。この件に関してRedditに検証ポストがあったので、簡単に内容をまとめてみる。 11月1日に

Baku

8か月前

11
GPT 3.5-turboが20Bパラメータという話の後日談

11

Baku

8か月前
【AIアニメ】AnimateDiffでアニメが作れるか？(1)

AnimateDiffを使うと数秒のアニメーションなら手軽に作れます。これらを編集してセリフをつければ、ちょっとしたショートアニメ作品も作れるのでは？と思いました。以前に試したものアニメ用のAI音声合成（Koeiromap）などは、以前の記事で試したことがあります。当時の投稿はこちら。ただ肝心のアニメーションについては、AI動画生成がまだ難しかったので、静止画を中心とした編集にせざるをえず。 9月に入りComfyUIでAnimateDiffを触りはじめ、少しづつ

Baku

8か月前

41
【AIアニメ】AnimateDiffでアニメが作れるか？(1)

41

Baku

8か月前
ComfyUI-LCMによるVid2Vidの高速変換を試す(Latent Consistency Models)

Latent Consistency Models（LCM）は、最小限のステップ数で迅速に推論できる新たな画像生成モデルです。例えば768x768の画像が2～4ステップ程度で生成できるとのこと（Stable Diffusionだとざっくり20ステップくらい）。このLCMをComfy UIの拡張機能として実装したのが「ComfyUI-LCM」です。 Comfy UI-LCMを使ったVid2Vidの動画変換ワークフローが紹介されていたので、試してみました（Control

Baku

9か月前

19
ComfyUI-LCMによるVid2Vidの高速変換を試す(Latent Consistency Models)

19

Baku

9か月前
ComfyUI AnimateDiffで戦前の映像をリマスターしてみる

Youtubeを見ていると、AIによって着色・高精細化した古い映像がアップされていたりします。 ComfyUI-AnimateDiffを利用すると、このようなモノクロ映像のAIリマスターを手軽に試すことができます。必要な準備ComfyUI本体の導入方法については、こちらをご参照ください。今回の作業でComfyUIに追加しておく必要があるものは以下の通りです。 1. カスタムノード次の2つを使います。 ComfyUI-AnimateDiff-Evolved（An

Baku

9か月前

19
ComfyUI AnimateDiffで戦前の映像をリマスターしてみる

19

Baku

9か月前
【AIアニメ】ComfyUI AnimateDiff でInpaintを試す

@toyxyz3さんのツイートで、ComfyUI AnimateDiffでのControlNet Inpaintの活用例が紹介されていました。上記の例では、静止画のうちマスクした部分が動画化されています。この記事では上記のワークフローを参考に「動画の一部をマスクし、inpaintで修正する」方法を試してみます。必要な準備ComfyUI本体の導入方法については、こちらをご参照ください。今回の作業でComfyUIに追加しておく必要があるものは以下の通りです。 1.

Baku

9か月前

13
【AIアニメ】ComfyUI AnimateDiff でInpaintを試す

13

Baku

9か月前

マガジン

AIアニメ

ローカルLLM

最近の記事

【AIアニメ】ComfyUIとSunoでシンプルなアニメMVをつくる

【AI動画生成】ComfyUIでポカリスエットCM風の動画をつくる

饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました

【ローカルLLM】言語モデルの知識編集を試す（Knowledge Editing）

【AIアニメ】ComfyUIとSunoでシンプルなアニメMVをつくる

【AI動画生成】ComfyUIでポカリスエットCM風の動画をつくる

饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました

【ローカルLLM】言語モデルの知識編集を試す（Knowledge Editing）

【llama.cpp】CPUとRAM、どっちが重要？

【llama.cpp】CPUとRAM、どっちが重要？

【ローカルLLM】Mixtral-8x7bをllama.cppで試す

【ローカルLLM】Mixtral-8x7bをllama.cppで試す

【llama.cpp】Qwen-14BをGGUF量子化して日本語で試す

【llama.cpp】Qwen-14BをGGUF量子化して日本語で試す

【AIアニメ】ComfyUIではじめるStable Video Diffusion

【AIアニメ】ComfyUIではじめるStable Video Diffusion

AnimateDiffでドット絵アニメをつくる / Pixel Art with AnimateDiff

AnimateDiffでドット絵アニメをつくる / Pixel Art with AnimateDiff

ComfyUI AnimateDiff + LCM-LoRAによる高速な動画生成を試す

ComfyUI AnimateDiff + LCM-LoRAによる高速な動画生成を試す

【AIアニメ】AnimateDiffでアニメが作れるか？(2)

【AIアニメ】AnimateDiffでアニメが作れるか？(2)

GPT 3.5-turboが20Bパラメータという話の後日談

GPT 3.5-turboが20Bパラメータという話の後日談

【AIアニメ】AnimateDiffでアニメが作れるか？(1)

【AIアニメ】AnimateDiffでアニメが作れるか？(1)

ComfyUI-LCMによるVid2Vidの高速変換を試す(Latent Consistency Models)

ComfyUI-LCMによるVid2Vidの高速変換を試す(Latent Consistency Models)

ComfyUI AnimateDiffで戦前の映像をリマスターしてみる

ComfyUI AnimateDiffで戦前の映像をリマスターしてみる

【AIアニメ】ComfyUI AnimateDiff でInpaintを試す

【AIアニメ】ComfyUI AnimateDiff でInpaintを試す