マガジンのカバー画像

ブログ

50
Catapp-Art3Dのブログです。
運営しているクリエイター

2024年7月の記事一覧

【独断】ローカルLLMのトップ3【偏見】

【独断】ローカルLLMのトップ3【偏見】

はじめにLLMとは(Large Language Model)の略称で、膨大な量のテキストデータを学習することで、人間のように自然な文章を生成したり、質問に答えたりすることができるAIモデルの事です。

ChatGPTやGemini等が有名ですが、パラメータサイズが400B〜1500B(1.5T)以上のそれらと異なり、家庭のパソコン(ローカル)で利用できる小規模なLLMです。一般に3B〜12Bのも

もっとみる
【ローカルLLM】Mistral-NeMo(12B)を使ってみた話

【ローカルLLM】Mistral-NeMo(12B)を使ってみた話

ローカルLLMとは、ChatGPTのような大規模言語モデルを、ローカルのパソコンで動かす小さなモデルの事です。ゲーミングPC程度の性能があれば、多くの言語モデルを動作させる事ができます。※ 筆者環境はRTX3060(12G)です

NVIDIA一押しのMistral社の多言語対応最新LLMモデルMistral-NeMoをOllamaで利用してみました。

ollama(Windows版)をインスト

もっとみる
【Ollama】Llama3.1を使ってみた話【ローカルLLM】

【Ollama】Llama3.1を使ってみた話【ローカルLLM】

はじめにOllamaでLlama3.1が利用できるようになったので、試してみました。

コマンドラインで簡易的に利用する場合は、Windows/Linux関係なくOllamaのgithubリポジトリから「OllamaSetup.exe」でインストールし、

ollama run llama3.1

とするだけで8Bモデルでチャットできます。GUIで本格的に利用する場合(Ollama Open We

もっとみる
【垢バン】Yahoo JAPANアカウントがつい先程停止された話【ヤホー】

【垢バン】Yahoo JAPANアカウントがつい先程停止された話【ヤホー】

基本的にYahooアカウントは利用していないのですが、タブレットのYahooニュースや天気情報のログインだけに利用していたものです。メールすら(迷惑メールは無限に溜まっていたようですが)一度も使った事はないアカウントです。

ニュースを見ようとアプリを開くと「認証が失敗しました」と表示されたあとに、利用停止の通知が。

どうやら問答無用の最凶バンのようで、復旧・確認・問い合わせすらできないようです

もっとみる
【ローカルはおバカ】やっぱりChatGPTは賢いと思った話【しかしクローズド】

【ローカルはおバカ】やっぱりChatGPTは賢いと思った話【しかしクローズド】

ローカルでLLMを利用する場合、基本的に出力がテキストのみなので、画像や図を表示させるには、何らかのツールや方法が必要になります。

そのひとつにPython言語でインタラクティブにやり取りできる(ローカルで利用できるオープンソースの)Jupyter Notebooksという技術があります。Google Colabとほぼ同じ機能のものです。

※ Anacondaをインストールしていれば、Jupy

もっとみる
【表情だけ動く】LivePortraitを使ってみた話【AI生成】

【表情だけ動く】LivePortraitを使ってみた話【AI生成】

はじめに静止画から表情変化の動画への変換が高速に処理できるという事で、ローカルでも十分利用できるのではないかと思い試してみました。

LivePortraitとは「ステッチング」と「リターゲティング制御」を組み合わせたポートレートアニメーション技術だそうです。調べていないので筆者には何の事かわかりません。

LivePortraitのレポジトリはこちら。

実際に利用(ComfyUIカスタムノード

もっとみる
【4.2LTS】Blenderベンチマーク

【4.2LTS】Blenderベンチマーク

はじめにBlender 4.2正式版がダウンロードできるようになったので、動作確認も兼ねてベンチマークを行いました。

動作環境筆者は現在2つのパソコンを利用しています。

Linux mint 21.3

i7-6700 + GTX-1660ti + GTX-1650

Windows 11 pro

Ryzen5-3600 + RTX 3060(12G)

これら2つのシステムのGPU組み合わ

もっとみる
【ラフ画AI生成】Kritaでステーキを描く【練習】

【ラフ画AI生成】Kritaでステーキを描く【練習】


はじめにKrita-ai-diffusionというKritaプラグインを利用すると、KritaでStable DiffusionによるAI画像生成を利用する事ができます。この記事はステーキ画像を練習として生成した過程の記録です。

Krita-ai-diffusion など筆者が利用するAIツールの導入方法はまとめてこちらで説明しています。

初期プロンプトとラフ画あまりステーキに詳しくなく一般

もっとみる
【ローカルLLM】大量のSDプロンプトデータをRAGとして利用してみる【AI画像プロンプト】

【ローカルLLM】大量のSDプロンプトデータをRAGとして利用してみる【AI画像プロンプト】

はじめにローカルLLMの精度や性能を上げるやり方の一つにRAG(Retrieval-Augmented Generation)というものがあります。書籍や資料、データベースなどを参照しながら指示に対する回答を生成します。

この記事では、画像生成のプロンプトを作成するためのRAG用データとして、大量のSDプロンプト例を利用した場合にどうなるかを試してみます。

ローカルLLMを動作させるために(o

もっとみる
【Linux】Visionモデルを画像管理に応用する【ローカルLLM】

【Linux】Visionモデルを画像管理に応用する【ローカルLLM】

はじめに※ Linux環境での記事ですが、WindowsのWSL Linuxでも利用可能です。

LLMをローカルで利用するメリットの一つとして、大量のデータをローカルPCで解析させるという使い方があります。もちろん、料金の問題もありますが、個人情報や著作物を含む可能性のある雑多な画像データを、送信可能かどうか人が確認する手間が無くなります。Googleドライブに肌面積の多い「アニメイラスト」を保

もっとみる
【ローカル日本語LLM】llama3-Elyzaを試す【llama3】

【ローカル日本語LLM】llama3-Elyzaを試す【llama3】


はじめに最近リリースされたLlama3ベースの日本語チューニングLLM ElyzaをOllama Open WebUIで利用してみました。

公式ELYZA Noteページはこちら

実際にダウンロードしたggufファイルはこちら、(ELYZA社のhuggingfaceページ)

Ollama Open WebUIの導入方法や使い方は下記にまとめています。

利用したmodelfile(テンプレ

もっとみる
【3Dモデル】髪のリアリティは大事【AI修正】

【3Dモデル】髪のリアリティは大事【AI修正】

髪の部分をAI化するだけで随分雰囲気がかわりますね。

3Dモデルは、

の3Dモデルに

のテクスチャを適用したものです。

Krita-ai-diffusionの導入解説(※ 特に既存のComfyUIをバックエンドとして利用する方法)を追加しました。

以上【PR】でした。

そもそもは、Blenderの画面をリアルタイムにKritaのレイヤーに表示できるという「Blender layer」と

もっとみる
Windows←→Linux間のクリップボード共有に四苦八苦した話

Windows←→Linux間のクリップボード共有に四苦八苦した話

筆者は異なるマシン間のファイル転送・共有手段として、今まで Join by Joaoapps というアプリを利用していました。Chromeブラウザ経由で同期でき、台数制限もなく、ほぼすべての機器や仮想マシンとの自動同期やクリップボード共有も使用できる便利な(買い切りの有料)アプリです。

しかし最近になって、Chromeか拡張機能のどちらかのアップデート後に
すべてのLinux Chrome版で

もっとみる
【ずんだもん】ローカルLLMにずんだもんの声で応答させる【LLM】

【ずんだもん】ローカルLLMにずんだもんの声で応答させる【LLM】

はじめにローカルLLMを実行できる ollama Open WebUI にずんだもんの声で応答させる「工夫」の紹介をします。各ソフトウェアのインストールさえできれば簡単に実現できます。

※ Open WebUI にはwebAPIのTTS読み上げ機能はありますが、VOICEVOX を直接操作する方法がないので、クリップボード経由での工夫です。Windowsでの説明を行います。

前提① VOICE

もっとみる