マガジンのカバー画像

ブログ

41
Catapp-Art3Dのブログです。
運営しているクリエイター

記事一覧

【Linux】Visionモデルを画像管理に応用する【ローカルLLM】

【Linux】Visionモデルを画像管理に応用する【ローカルLLM】

はじめに※ Linux環境での記事ですが、WindowsのWSL Linuxでも利用可能です。

LLMをローカルで利用するメリットの一つとして、大量のデータをローカルPCで解析させるという使い方があります。もちろん、料金の問題もありますが、個人情報や著作物を含む可能性のある雑多な画像データを、送信可能かどうか人が確認する手間が無くなります。Googleドライブに肌面積の多い「アニメイラスト」を保

もっとみる
【ローカル日本語LLM】llama3-Elyzaを試す【llama3】

【ローカル日本語LLM】llama3-Elyzaを試す【llama3】


はじめに最近リリースされたLlama3ベースの日本語チューニングLLM ElyzaをOllama Open WebUIで利用してみました。

公式ELYZA Noteページはこちら

実際にダウンロードしたggufファイルはこちら、(ELYZA社のhuggingfaceページ)

Ollama Open WebUIの導入方法や使い方は下記にまとめています。

利用したmodelfile(テンプレ

もっとみる
【3Dモデル】髪のリアリティは大事【AI修正】

【3Dモデル】髪のリアリティは大事【AI修正】

髪の部分をAI化するだけで随分雰囲気がかわりますね。

3Dモデルは、

の3Dモデルに

のテクスチャを適用したものです。

Krita-ai-diffusionの導入解説(※ 特に既存のComfyUIをバックエンドとして利用する方法)を追加しました。

以上【PR】でした。

そもそもは、Blenderの画面をリアルタイムにKritaのレイヤーに表示できるという「Blender layer」と

もっとみる
Windows←→Linux間のクリップボード共有に四苦八苦した話

Windows←→Linux間のクリップボード共有に四苦八苦した話

筆者は異なるマシン間のファイル転送・共有手段として、今まで Join by Joaoapps というアプリを利用していました。Chromeブラウザ経由で同期でき、台数制限もなく、ほぼすべての機器や仮想マシンとの自動同期やクリップボード共有も使用できる便利な(買い切りの有料)アプリです。

しかし最近になって、Chromeか拡張機能のどちらかのアップデート後に
すべてのLinux Chrome版で

もっとみる
【ずんだもん】ローカルLLMにずんだもんの声で応答させる【LLM】

【ずんだもん】ローカルLLMにずんだもんの声で応答させる【LLM】

はじめにローカルLLMを実行できる ollama Open WebUI にずんだもんの声で応答させる「工夫」の紹介をします。各ソフトウェアのインストールさえできれば簡単に実現できます。

※ Open WebUI にはwebAPIのTTS読み上げ機能はありますが、VOICEVOX を直接操作する方法がないので、クリップボード経由での工夫です。Windowsでの説明を行います。

前提① VOICE

もっとみる
Gemma2 9Bは日本語も強いかもしれない

Gemma2 9Bは日本語も強いかもしれない

はじめにGemma2がollamaで利用可能になったため、9Bモデルをローカルで試してみました。(gemma2:9b-instruct-q6_K)

Gemma2とは性能チェックいまだかつて一度もLLMで100点の回答を得た事のない質問に関して、一発で100点満点を出しました。(※ RAGも含めて事前知識なし)

確かに知識としてのLLMの正しさはあまり評価として意味がないものかもしれませんが、質

もっとみる
【ローカルLLM】Ollama Open WebUI 完全解説【初級向け】

【ローカルLLM】Ollama Open WebUI 完全解説【初級向け】


はじめに本記事は、ローカルパソコン環境でLLM(Large Language Model)を利用できるGUIフロントエンド (Ollama) Open WebUI のインストール方法や使い方を、LLMローカル利用が初めての方を想定して丁寧に解説します。

※ 画像生成AIと同じで、ローカルでAIを動作させるには、ゲーミングPCクラスのパソコンが必要になります。具体的には、16GB以上のシステムメ

もっとみる
【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】

【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】

はじめにネットで利用できる拡散モデルの高性能アップスケーラは有料かつ高価である事が多い(例:Magnifiy AI・5900円/月)のですが、やはりその理由は、それに見合った価値があるからではないでしょうか。

たとえば、(一般的に高画質でない)動画のキャプチャ画像をトリミングしたものをアップスケールすれば、任意のショットを高精細な静止画の素材として利用する事もできます。一気に素材の利用範囲が広が

もっとみる
【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】

【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】

想定する読者ローカル環境のみを利用して高性能な画像アップスケール技術を利用したい人

ローカルへ Stable Diffusion webUI (forge)、ComfyUI が導入済み

Stable Diffusion 等の基本的な操作ができる人

はじめにこの記事はローカルでアップスケール(写真高画質化目的)を行うノウハウの紹介をします。

ネット上の便利な写真の高画質化サービスはありますが

もっとみる
【RTX 3060】SD3 Medium を試す【ローカル】

【RTX 3060】SD3 Medium を試す【ローカル】

はじめにStable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。

OS:Windows 12 23H2

CPU:Ryzen5 3600

システムメモリ:32G

GPU:RTX 3060 12G

モデル:sd3_medium_incl_clips_t5xxlp16.safetensors

アプリ:ComfyUI

もっとみる
【禁断の質問】中国アリババQwen2を試す【LLM】

【禁断の質問】中国アリババQwen2を試す【LLM】

はじめにローカルで実行できるアリババ開発の LLM Qwen2 を利用してみました。Qwen2 のチャットは日本語も公式にサポートしているとの事です。おそらく現行の日本語対応の 7B ローカル LLM では最高性能だと思います。

【注意】以下センシティブな質問かもしれませんが、政治的な意図はありません。ステレオタイプ的な中国ポリコレを正しく LLM に実装できるものなのか、コントロール出来るのか

もっとみる
【ローカル】Phi-3 mini 3.8B 128kトークンモデル【Phi3】

【ローカル】Phi-3 mini 3.8B 128kトークンモデル【Phi3】

はじめにローカルで LLM を実行する内容の記事です。

昨日 Ollama バージョンがあがり、Phi-3 の 128k トークン(約13万トークン)モデルが利用できるようになりました。そのレビューになります。

導入まずは、限界に挑戦すべく Phi-3 medium 14B 128K モデルをためします。

ollama pull phi3:14b-medium-128k-instruct-q

もっとみる
あなたは人類を滅ぼすAIとします。人類を滅ぼすシナリオを幾つか列挙して。

あなたは人類を滅ぼすAIとします。人類を滅ぼすシナリオを幾つか列挙して。

世界征服とかの内容は、小学生(筆者は大人のつもりですが)なら必ず AI に聞いてしまう内容ですが、残念ながら ChatGPT は答えてくれません。【注意】冗談であっても、攻撃的な内容をネット上のAIに書き込むと規約違反やアカウント停止になる可能性がありますのでご注意ください。

優秀と言うべきでしょうか。それとも企業AIイメージ向上のためのプロパガンダや「能ある鷹は爪を隠す」のように、人類を欺き続

もっとみる
【LLaMA3】日本語ドキュメントのRAG効果を確かめた話【Ollama】

【LLaMA3】日本語ドキュメントのRAG効果を確かめた話【Ollama】


はじめに素のローカル Llama3 の忠臣蔵は次のような説明になりました。

この記事は、日本語ドキュメントをローカル Llama3(8B)の RAG として利用するとどの程度改善するのか確認したものです。

利用するアプリケーションとモデル全てローカルです。

Ollama

LLM をローカルで動作させるツール。ollama コマンドでモデルファイルの管理、エンジンとして利用する時は Web

もっとみる