マガジンのカバー画像

その他 Tech関連

36
運営しているクリエイター

#写真

Mac mini M1(8GB) で 生成 AI を試す ~ ローカル環境を低コストで

まえがき最初に書いておきますが、ガシガシ使いたい方にはオススメしません。 1枚生成するのに 512x512 で 15s、768x1152 で 57s 程度は掛かります。 (Sampling steps:20、Upscale:なし、VAE:vae-ft-mse-840000-ema-pruned、Refiner、Face Restoration) Windows で高性能な GPU カード挿せば~数秒、Google Colab でも(枚数制限等ありますが)10秒程度で生成

Generative AI(リアル系画像生成)をしばらく試してみて ~ 自分で撮った写真を使って img2img

まえがきいや~、しかし AI 関連 、今年は特にもう、あまりにも進歩が早すぎてついて行けませんね。(;´Д`) ChatGPT さんにも、コード書くときとかそれなりにお世話になっております。 さて今回は、画像生成 AI のお話です。 私は趣味でポートレート写真を撮るので、リアル系画像生成に興味があります。でも今は GPU 搭載 PC を持ってないので、Google Colab 無料プランで 3 月頭くらいからリアル系画像生成 AI を試してみていました 。 Googl

単眼立体視の話~脳は複数の情報から使えるものを使って認識する

平面立体視立体画像を平面ディスプレイで再現するには、脳が視差情報から奥行き感を再構築できることを利用し、視差の異なる2枚の画像をそれぞれ左右の目に提示する方法が一般的です。 平行法、あるいは交差法を用いて視差情報から立体像を再構築できる 「視差」が立体視の強い手掛かり 一方、写真を立体的に見るには、「片眼で見る」という方法が古くから知られています(ポジフィルムを単眼鏡で見る等) 実は、人間が奥行き感を感じる手掛かりとしては視差以外にも、オクルージョン(重なり)、相対サイ

白黒画像がカラーに見える?~カラーイルージョン(色の錯視)を作ろう~色順応とは?

カラーイルージョン今年の10月に立ち上げた、AudiiSion Sound Lab. その会社名の由来は、人の脳の認識の仕組みを利用した新しいデジタルオーディオ信号処理技術を売り物にしようと、聴覚の錯覚(=錯聴 Auditory illusion)を元にした造語です。 それはともかく、今回は聴覚ではなく視覚の錯覚(=錯視 Optical illusion)のお話です。 まずは早速デモ画像をご覧ください。 左が元画像、中央が変な色付き画像で、右が白黒。 下のGIF画像

「先鋭化」なのに「アンシャープ」??~「アンシャープマスク」とは?

画像の先鋭化処理としても最もよく使われるのが「アンシャープマスク(Unsharp masking)」です。 写真をやる人であればほとんどの人が、聞いたこと・使ったことがあるのではないでしょうか。 「先鋭化」なのに、なぜ「アンシャープ」?? と思われる方もいるかもしれません。 これは、大昔から用いられていた、「ぼかしたネガ(アンシャープマスク)をポジフィルムに重ねて現像するとクッキリする」というフィルム現像テクニックが元になっています。 波形で見てみましょう。 1.