GPT-4V（GPT-4 with Vision）

2023年11月20日 17:33

2023.11.07

GPT-4に画像解析機能と音声出力機能が追加され、マルチモーダルAI（GTP-4V）になったということで、国立競技場のザハ・ハディド案をアップロードして説明させてみました。

人間でも、画像をこんな風に明快に言語化できる人は少ないと思います。まあ確かに、ザハ案を知らない人ならこんな説明をするかもって感じ。

それから、今後は説明文をDALL-E 3に入力して、画像を生成させてみました。こちらも、ザハ案と言わずにこの説明文でスケッチを描いてみろと言われたら、こんな絵になるかも知れません。

マルチモーダルAIで自然文と画像を行ったり来たりしながらブレインストーミングをすると、自分だけではなかなか思いつかない意見を得られるかも～

この記事が気に入ったらサポートをしてみませんか？