見出し画像

DiffBIRを試してみた。

こんにちはたまき(AIに語りかける者)です。

古来より写真を撮る人が追い求めて止まないモノがある。

それは…

ピンボケなどの修正!

いや、しらんけど。

実際はもうその辺りかなり機器に取り入れられているはず。同じ液晶パネルでも各社で味付けが違うとか、そういうのもある。

ワイなんかは記録に残っておけば、ピンボケだろうが露出不足だろうが、そのうちテクノロジーが解決してくれると思ってるから画像の出来に関わらず、昔から色々撮り溜めてる。

そんななか、これぞAIの王道の使い道というのを見かけたので試してみました。

DiffBIRというやつです。

こちらのノートがいまのところ詳しい。まだあんまり日本語情報がない。

ここで試せます。

で、いろんな画像で試したので、その結果をシェアします。

検証画像

まずはこちらの画像。

多分50年前ぐらいの親戚の集まり。最初コレを突っ込んだらエラーが出た。プリントをスキャナーで取り込んだデータなので元々のサイズがでかすぎるのが原因。なので、顔の部分だけをトリミングして再挑戦。


うーん、いまいち… ワイシャツの白とチョッキの境目はくっきりはっきりした。右側の押し入れの襖などもはっきりしている。逆にバックの柄入の磨りガラスの模様が消えている。

ふむ。多分光量が足りんのかな。というわけで明るい画像で試す。

おー、コレはかなりキレイに出た。人もそうだけれど背景のどれもが素晴らしく細かく出てる。コレはやっぱりDiffBIRが推論するときのポイントなのかも。

次からは元画像が640x480の画像。20年前にロンドンに買付に行った際にカシオのカード型デジカメExilimで撮った画像です。
以下、元画像、DiffBIR画像で続けます。

ゆで卵やレモンカトラリーはうまく出てますが、真ん中のなにかはAI特有のノイズ模様になってますね。ちなみにコレは地方のホテルのディナーですね。不味くはなかった…うまくもなかった。

レンガは規則的なのでよく出ていますが看板の文字がやられてます。
光量不足ですが割りとうまくいってる。ちなみにコレはカレーの冷凍食品です。当時のイギリスではエスニックフードかファストフード食っておけば間違いなかった。イタリアンはいまいちなのに高かった…
これは割りとよく出てるけれど元画像の画素数が少なすぎて潰れてますね。ハイドパークです。
奥のロンドンバスがちょっとグダってますね。
コレは割りといい感じ。ナンバーがAI生成らしくダメ。やはり文字はダメか。
これぐらいの文字の大きさでもダメかー。元画像だとジュビリーマーケットホールと読めますがDiffBIRだと一部がおかしくなってますね。あと人の顔もおかしいですね。ディスプレイされてるアンティークの銀食器もなんだかよくわからねぇ。
コレはプラモデルのディスプレイ。奥のトラクターの模型がいまいち。
ビッグベン。時計の文字盤が変。
野良リス。なんかノッペリしてますね。
これは建物の壁面もダメだし、人が消えてるのもダメだ。ちなカムデンタウンかな。


大韓航空の飛行機で流れていたK-POP(嘘、歌謡曲的な、ポンチャク的なやつ)の画面。ネガティブプロンプトを入れていない顔の崩れ方。DiffBIRでもプロンプトが入れられるみたいなので、入れれば変わる?

コレが自動的に入っているNP。

こちらはワイがいつも使ってるNP。果たして…

変わらず!残念… この辺りやり込みが必要なのかな。それは他の人にまかそう。
文字の変換部分をアップで。


全然ダメですね。


以上です。

まとめ

とりあえず、そこまですごくはなかった。まぁ、難しいね。多分、チェリーピッキングされてるかな。ハマるものもあるし、お試しあれ。

それではまた。

食レポシリーズもよろしくお願いします。


この記事が気に入ったらサポートをしてみませんか?