マガジンのカバー画像

ブログ

36
Catapp-Art3Dのブログです。
運営しているクリエイター

2024年4月の記事一覧

「AI生成画像はGPUによって個性がある」は都市伝説か?

「AI生成画像はGPUによって個性がある」は都市伝説か?

はじめに先に結論です。限りなく都市伝説でしょう。しかし、オーディオ専用CDプレーヤが(エラー訂正精度の問題で完全なデジタルとは言えない事を根拠に)高音質であるという話題が尽きないように、プリンターケーブルを短くすれば(ネットワークエラー率が下がり)早く印刷できるという話を完全に否定できないように、真っ赤な嘘という話でもありません。

アーキテクチャが異なれば画像は異なる当たり前の話ですが、世代など

もっとみる
Adobe Firefly がクリーンではないと言われる理由

Adobe Firefly がクリーンではないと言われる理由

画像生成AI技術がありふれたものに変わり、最近では拒否反応のようなAI画像はすべて盗作だとする極論的な論調は少なくなってきました。それでも、企業はAIモデルや学習時の「クリーン」さを強調する必要性に迫られています。

企業がクリーンさを強調する手法の一つで、最大手 Adobe がAI技術に参入した際に取ったものは、自社の画像ライブラリのみで学習するというものです。確かに自社で所有する画像であれば、

もっとみる
【無修正】Llama3 Uncensored を試す【脱獄モデル】

【無修正】Llama3 Uncensored を試す【脱獄モデル】

はじめに文章生成AI(LLM)の Uncensored は仰々しく聞こえてしまいますが、実は Stable Diffusion webUI 等のAI画像生成系は最初からデフォルトで脱獄しています。元々のコードは生成途中で觝触すれば黒塗り画像に差し替えるようになっています。昔はミーム画像に変わったりしていたのですが、最近はどの画像生成システムでも見なくなりました。

確かに、LLM は画像だけの生成

もっとみる
【GTX 1660ti】Meta Llama3をローカルで動かした話【GTX 1650】

【GTX 1660ti】Meta Llama3をローカルで動かした話【GTX 1650】

想定している読者非技術者・非開発者(AIを道具として利用している人)

Linux の基本的な操作ができる人

Windows の場合は WSL2 が利用できる人

自分のローカル環境 GPU で LLM(ChatGPTのようなもの)を動作させたい人

はじめにローカルで動作が可能な Meta 最新 LLM Llama3(Language Large Models Meta AI) を 旧GTX

もっとみる
【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

いつの間にか、Gemini に画像や動画なども同時に表示されるようになってますね。

髪型の名称が欲しい時は、

ポーズの場合は、

非常に便利になりました。

ある学者が言ってましたが、これからのプロンプトエンジニアリングは AI が行うべきものという話でした。AI からより良い情報や回答を得るために、人がエンジニアリングとして分析した理屈でなく(そのシステムの) AI がアシストする。確かに理

もっとみる
【StableDiffusion】歴史上の美女をAI画像生成していく【GTX 1660ti】

【StableDiffusion】歴史上の美女をAI画像生成していく【GTX 1660ti】

はじめに筆者が利用している AI 用のより高速な PC は RTX 3060 なのですが、長時間の学習に利用しているため、ただ単に仕方なく GTX 1660ti を使うというだけの話です。チェックポイントはカスタムモデルですが SDXL 生成そのままの画像です。

Gemini に聞いてみました。

※ AIに聞くときに、「全力で」「精一杯」などの表現を追加すると、ちょっとだけがんばってくれます。

もっとみる
InstantMesh(画像1枚から3Dモデル・ローカル生成) 面白い

InstantMesh(画像1枚から3Dモデル・ローカル生成) 面白い

下記にて紹介しましたが、

予想以上に使えそうなので、InstantMesh の Windows でのインストール方法と簡単な使い方を追加しました。

AIで好きな画像を生成し、

この一枚の画像をデスクトップに保存したバッチファイルにドラッグ&ドロップすると、

デスクトップ上のフォルダに、3Dモデルが自動で作成されます。RTX 3060 (12G) で2分程度です。

すごい時代になったもので

もっとみる
InstantMeshを使ってみた話

InstantMeshを使ってみた話

はじめにAI画像生成界隈では、日々さまざまな技術が発表されています。この記事ではその中のひとつの InstantMesh というものを試してみます。

公式レポジトリはこちら

どのようなものかというと、一枚の画像から3Dオブジェクトを生成するソフトウェアです。

導入方法README に導入方法が紹介されています。Anaconda + pip 方式です。本当は下記方法をマスターしたら簡単ですよ、

もっとみる
人物の白黒写真高画質カラー化の話

人物の白黒写真高画質カラー化の話

はじめに同じ手法を利用します。

準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。

結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。

戦艦大和をカラー高画質化させてみた話

戦艦大和をカラー高画質化させてみた話

はじめに生成 AI 技術を利用して、戦艦大和の白黒写真のカラー高画質化に挑戦します。元画像は、Wikipedia のパブリックドメイン写真を利用します。

カラー化まずは、カラー化のみを行います。利用したソフトウェアは Deoldifyを使います。公式のリポジトリはこちら。

導入方法は、(まだ)DeOldify に関して記述していませんが、Anaconda 導入です。下記を参考ください。

De

もっとみる
LCMはなぜ高画質なのか?【StableDiffusion】

LCMはなぜ高画質なのか?【StableDiffusion】

Stable Diffusion を利用する多くの人が疑問に思っている事だと思いますが、ステップ数の少ない LCM モデルや LCM-LoRA が「高画質」になる理由は、実は簡単です。

SDXL よりも SD1.5 の方が写真に近いという話をしましたが、それと同じです。単純に自由度が少ないからです。潜在空間でズルしてコンストレイントをかけたのが LCM 、LoRA も low rank adap

もっとみる
【RTX3060】RTX Video Super Resolution を使ってみた話【1080p】

【RTX3060】RTX Video Super Resolution を使ってみた話【1080p】

はじめに昨年から話題になっていたことは知っていたのですが、非HDRの1080pディスプレイでは利用できないという話で、そのままにしていました。

最近、1080pディスプレイでもそれなりに効果があるという情報を聞いたので、実際に試してみました。

RTX VSR とはAIで生成した文章そのままですが、私の知る限りの知識では、すべて正しい情報だと思います。

ただし、この記事では Copiloが言う

もっとみる
AIを利用して、PBRテクスチャ作成に挑戦してみた話②

AIを利用して、PBRテクスチャ作成に挑戦してみた話②

はじめに下記記事のつづきです。

布に挑戦します。

テクスチャ生成Stable Diffusion の tiling 機能を使って、着物用の織物テクスチャを生成します。

凸凹表現Marigold でどこまで表現できるか試します。

模様は問題ないのですが、布の表面までは流石に無理でした。法線マップも生成を試してみましたが、予想どおりイマイチです。

結果Blender で確認します。

まとめ

もっとみる
AIを利用して、PBRテクスチャ作成に挑戦してみた話①

AIを利用して、PBRテクスチャ作成に挑戦してみた話①

はじめに忙しい皆様のために先に結論です。満足度は30%で、もう少し工夫が必要そうです。

PBR(Physically-Based Rendering)テスクチャとは、光の拡散、法線、凹凸情報などが物理的に正しいテクスチャの事を言います。AI技術を利用すれば、立体構造が簡単に作れるのですが、テクスチャのような微細構造まで再現できるようなものはありませんでした。しかし Marigold のような詳細

もっとみる