- 運営しているクリエイター
2024年4月の記事一覧
「AI生成画像はGPUによって個性がある」は都市伝説か?
はじめに先に結論です。限りなく都市伝説でしょう。しかし、オーディオ専用CDプレーヤが(エラー訂正精度の問題で完全なデジタルとは言えない事を根拠に)高音質であるという話題が尽きないように、プリンターケーブルを短くすれば(ネットワークエラー率が下がり)早く印刷できるという話を完全に否定できないように、真っ赤な嘘という話でもありません。
アーキテクチャが異なれば画像は異なる当たり前の話ですが、世代など
Adobe Firefly がクリーンではないと言われる理由
画像生成AI技術がありふれたものに変わり、最近では拒否反応のようなAI画像はすべて盗作だとする極論的な論調は少なくなってきました。それでも、企業はAIモデルや学習時の「クリーン」さを強調する必要性に迫られています。
企業がクリーンさを強調する手法の一つで、最大手 Adobe がAI技術に参入した際に取ったものは、自社の画像ライブラリのみで学習するというものです。確かに自社で所有する画像であれば、
【GTX 1660ti】Meta Llama3をローカルで動かした話【GTX 1650】
想定している読者非技術者・非開発者(AIを道具として利用している人)
Linux の基本的な操作ができる人
Windows の場合は WSL2 が利用できる人
自分のローカル環境 GPU で LLM(ChatGPTのようなもの)を動作させたい人
はじめにローカルで動作が可能な Meta 最新 LLM Llama3(Language Large Models Meta AI) を 旧GTX
【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】
いつの間にか、Gemini に画像や動画なども同時に表示されるようになってますね。
髪型の名称が欲しい時は、
ポーズの場合は、
非常に便利になりました。
ある学者が言ってましたが、これからのプロンプトエンジニアリングは AI が行うべきものという話でした。AI からより良い情報や回答を得るために、人がエンジニアリングとして分析した理屈でなく(そのシステムの) AI がアシストする。確かに理
InstantMesh(画像1枚から3Dモデル・ローカル生成) 面白い
下記にて紹介しましたが、
予想以上に使えそうなので、InstantMesh の Windows でのインストール方法と簡単な使い方を追加しました。
AIで好きな画像を生成し、
この一枚の画像をデスクトップに保存したバッチファイルにドラッグ&ドロップすると、
デスクトップ上のフォルダに、3Dモデルが自動で作成されます。RTX 3060 (12G) で2分程度です。
すごい時代になったもので
人物の白黒写真高画質カラー化の話
はじめに同じ手法を利用します。
準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。
結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。
LCMはなぜ高画質なのか?【StableDiffusion】
Stable Diffusion を利用する多くの人が疑問に思っている事だと思いますが、ステップ数の少ない LCM モデルや LCM-LoRA が「高画質」になる理由は、実は簡単です。
SDXL よりも SD1.5 の方が写真に近いという話をしましたが、それと同じです。単純に自由度が少ないからです。潜在空間でズルしてコンストレイントをかけたのが LCM 、LoRA も low rank adap
AIを利用して、PBRテクスチャ作成に挑戦してみた話②
はじめに下記記事のつづきです。
布に挑戦します。
テクスチャ生成Stable Diffusion の tiling 機能を使って、着物用の織物テクスチャを生成します。
凸凹表現Marigold でどこまで表現できるか試します。
模様は問題ないのですが、布の表面までは流石に無理でした。法線マップも生成を試してみましたが、予想どおりイマイチです。
結果Blender で確認します。
まとめ
AIを利用して、PBRテクスチャ作成に挑戦してみた話①
はじめに忙しい皆様のために先に結論です。満足度は30%で、もう少し工夫が必要そうです。
PBR(Physically-Based Rendering)テスクチャとは、光の拡散、法線、凹凸情報などが物理的に正しいテクスチャの事を言います。AI技術を利用すれば、立体構造が簡単に作れるのですが、テクスチャのような微細構造まで再現できるようなものはありませんでした。しかし Marigold のような詳細