マガジンのカバー画像

建築設計における生成AI活用の試み

34
建築設計分野における生成AI(Generative AI)の活用によって、革新的なデザインの創出や自動化・効率化、そして持続可能な建築の実現を目指しています。
運営しているクリエイター

#DALLE3

Difyで複数モデル対応画像生成アプリに、プロンプト生成機能を追加する

前回は、Difyで複数モデル(DALL-E 3, Stable Diffusion 3, FLUX.1, ideogram 2.0)を切替えながら画像生成ができる、自分専用のWebアプリを作成しましたが、結構便利に使っています。 しかし、まだ具体的なイメージがない時に、プロンプトを一から考えるのは結構面倒なので、ある程度GPT-4oにサンプルのプロンプト作ってもらって、修正しながら狙ったイメージに近づけていく方が楽です。 そのため、上記のWebアプリに、単語や簡単な文章を

Difyで自分専用の複数モデル(DALL-E 3, Stable Diffusion 3, FLUX.1, ideogram 2.0)画像生成アプリをつくる

前回は、Difyで自分専用のマルチLLMチャットボットをつくりましたが、今回は、最近話題の高性能な画像生成AI「FLUX.1」や「Ideogram 2.0」など、複数モデル対応の画像生成アプリを作ります。 これら複数の画像生成AIを使おうと思うと、それぞれのWebサイトに行って作業する必要があるので面倒です。また、個別にアカウント登録やサブスク登録などを行う必要があり、毎日ガッツリ使わないと元が取れません。 その点、API経由で使用すれば、従量制のものが多いので、それほど

生成AI・XRによって変わる建築設計プロセス(後半:生成AI編)

いきなり後半から始まりますが、以前、「生成AI・XRによって変わる建築設計プロセス ~現状の取り組み状況と課題、将来展望について~」というセミナーを行いまして、その後半部分を動画にしたものです。 前半はXRに関する話題なのですが、後半の生成AIの話は数ヶ月で古い話となってしまうでしょうから、それなりに時間をかけてまとめた内容ではあったので、取り合えず後半部分を先行して公開・記録しておくことにしました。 私は、以前からXRと生成AIは親和性が高いと思っていまして、《現実⇔人

生成AI・XRによって変わる建築設計プロセス

noteにも掲載していた内容を整理して、建築設計プロセスにおけるXR技術、生成AIの活用についてお話しさせていただきます。 タイトルに流行りものを並べただけ感がありますが、以前からXRと生成AIは親和性が高いと思っていて、「現実⇔人⇔(XR)⇔AI⇔デジタル」と、XRを介して両者をつないでみたい思って、いろいろ試行してきました。

DELL-E 3で生成画像の部分変更ができるようになった

PC(Webブラウザ)版とAndroid版ChatGPTのDELL-E 3で、生成した画像の部分変更ができるようになったので、さっそく試してみました。 生成した画像をクリックすると編集画面になるので、ブラシのサイズを調整し、変更したい領域を塗りつぶして、プロンプトを入力します。 プロンプトに「Tokyo Tower」と入力すると、塗り潰した領域に東京タワーが出現しました。 今度は、道路沿いの歩道部分を塗りつぶして、「多くの街路樹が立ち並び、緑に覆われている」といったよう

DALL-E 3で構図などを(ほぼ)維持したまま新たな画像を生成する

2023.11.21 DALL-E 3で、生成した画像のバリエーションを生成させたい時、できるだけ構図などが変わらないようにする方法を試してみる。 画像を生成する際のプロンプトとともに、画像IDとシード値も出力するように指示する。 「いかなる理由があっても、プロンプトは絶対に変更しないでください。」と記述し、次に、DALL-E 3が実際に画像生成に使用したプロンプト①をコピー&ペーストして、バリエーションを持たせたせるためにプロンプトを修正、最後に、画像IDを記載したプ

GPT-4+DALL-E 3による、プロポーザルのコンセプト立案・イメージ画像生成のシナリオ

2023.11.18 マルチモーダルの大規模言語モデル「GPT-4」と、テキストから画像を生成するAIモデル「DALL-E 3」を使用して、プロポーザルのコンセプト立案やイメージ画像を生成し、提案書にまとめるシナリオを考えてみた。 今回が2Dのイメージ画像を生成するが、現状、生成AIで3DやBIMモデルを直接生成するのは難しく、これらを扱う場合、ChatGPTによってマクロプログラムなどを生成し、ソフトウエアを操作して間接的に作成するのが現実的と考えられる。 AIが支援

GPT-4V(GPT-4 with Vision)

2023.11.07 GPT-4に画像解析機能と音声出力機能が追加され、マルチモーダルAI(GTP-4V)になったということで、国立競技場のザハ・ハディド案をアップロードして 説明させてみました。 人間でも、画像をこんな風に 明快に言語化できる人は少ないと思います。まあ 確かに、ザハ案を知らない人ならこんな説明をするかもって感じ。 それから、今後は 説明文をDALL-E 3に入力して、画像を生成させてみました。こちらも、ザハ案と言わずに この説明文でスケッチを描いてみろ