生成系AIに画像を見せてみる
この記事は「公立はこだて未来大学 Advent Calendar 2023」11日目の記事です。
はじめに
こんにちは、いかの塩辛です。
OpenAIのChatGPTとか、GoogleのBardとか、MicrosoftのBing AIとか最近の生成系AIって画像から文章作れてすごい。
ということで、今回は生成系AIに画像見せてなんかいい感じの文章を作ってもらいましょう。
Painter
最初はこれ。
「絵画」というテーマに沿ってProcessingで作ったやつです。
こわいなーって、おどろおどろしいなーって
リポジトリ
Colors in Concert: Harmony in Diversity
はーもにーいんだいばーしてぃ、かっこいい
未来的な世界とか無限の可能性とか色彩とか、どこ見て言ってるんだろう。
暗い色ばかりなのに無理に明るく振る舞わなくてもいいんだよ。
色彩の饗宴だって。狂宴の間違いなんじゃないかな
GrassHelix
次はこれ
透明な玉を二重螺旋で配置したものです。
きれーだなって、光の加減がきれーだなって
リポジトリ
ChatGPTは最初の出力がなぜか英語だからかこのフォーマットで返すようになってしまった。
キャッチコピーって言ってるのにまるでタイトルをつけるかのような出力だね、GPT-4さん。
画像を拝見しました。
この画像は、海岸で撮影された泡の写真をモノクロで表現したものですね。泡の儚さや、海の広大さを表現した作品だと感じました。
一文のキャッチコピーとしては、以下のようなものが考えられます。
* **「泡の儚さの中に、海の広大さ。」**
* **「一瞬の美しさ、永遠の記憶。」**
* **「儚さの中に、生命の輝き。」**
これらのキャッチコピーは、画像の特徴である「泡の儚さ」と「海の広大さ」を強調しています。また、画像が持つ「一瞬の美しさ」や「生命の輝き」といったイメージも表現しています。
具体的な用途やターゲットに合わせて、キャッチコピーを調整することもできます。例えば、写真集のタイトルであれば、以下のようなものも考えられます。
* **「泡の儚さ」**
* **「海の記憶」**
* **「生命の輝き」**
このように、画像の印象やメッセージを効果的に伝えられるキャッチコピーを考えてみてください。
Bardさんの出力は長い。
キャッチコピーを言った後に無駄に補足説明を入れてくる。
まるでメンターやってる時の私みたい。
でもキャッチコピーって感じはするね。
Bing AIは神経質なのか5個も候補を出してくれる。
余程人間たちに5個未満じゃ足りねえとでも言われたのかな。
「無限の可能性」、「宇宙の彼方へ」とか見て某ライトイヤーが頭から離れなくなった。
SpongePool
最後にこれ
みんな一度は興奮したであろうスポンジプールをモチーフにした画像。
リポジトリ
Chaos in Order: The Intricate Dance of Geometric Dreams
カオスインオーダー!!
秩序の中の混沌だってかっこいい。
この文字列だとスプラトゥーン2のラストフェスを思い出す。
画像を拝見しました。
この画像は、黒い背景にカラフルな立方体が浮かんでいる抽象的な作品ですね。立方体の形や色彩の組み合わせが印象的です。
一文のキャッチコピーとしては、以下のようなものが考えられます。
* **「無限の可能性を秘めた、カラフルな世界。」**
* **「色彩のパワーが、あなたの心を解き放つ。」**
* **「未来への扉を開く、カラフルな鍵。」**
これらのキャッチコピーは、画像の特徴である「カラフルな立方体」と「無限の可能性」を強調しています。また、画像が持つ「未来的な雰囲気」や「解放感」といったイメージも表現しています。
具体的な用途やターゲットに合わせて、キャッチコピーを調整することもできます。例えば、アート作品のタイトルであれば、以下のようなものも考えられます。
* **「カラフルな宇宙」**
* **「未来の鍵」**
* **「無限の可能性」**
このように、画像の印象やメッセージを効果的に伝えられるキャッチコピーを考えてみてください。
また、この画像は、立方体の形や色彩の組み合わせが印象的なので、以下のようなものも考えられます。
* **「立方体の無限の可能性」**
* **「色彩の魔法」**
* **「未来への扉」**
このように、画像の特徴をより具体的に表現することもできます。
Bardさん
赤というかピンク一色なので色彩とカラフル要素どこなんだろうってツッコミしか湧かなかった。
未来の鍵ってキャッチコピーはなんとなく良さそう。
ネオン的な色合いになっているのが未来を感じさせるのかな?
お前の画像抽象的だから俺もそんなキャッチコピー作るね!ってのは煽りだと思う。
おわりに
いかがでしたか?ってよくある薄っぺらい記事の文字列自体は、それらの記事が好ましいかはさて置き好きだったりする。
一通り眺めてみると、キャッチコピーの質はともかくとしてどの生成系AIも画像自体の言語化はできてそうだと感じたから、中々に優秀なのだなと思った。
ほんとはIntelliJ IDEAのPlugin作ってみたとかCompose for Webの去年からの進化とかやってみたかったんだけど、卒業研究の忙しさを舐めてた。
明日はかすまるさんの「魔王魂「シャイニングスター」を数式化してみた(「アイドル」は著作権の問題で不可能になりました。申し訳ありません。)」っていうちゃんと真面目そうなやつなので期待してください。