![見出し画像](https://assets.st-note.com/production/uploads/images/127220031/rectangle_large_type_2_4b9f64f3167512fa21b5a1635fd16ade.png?width=800)
すごいタイミングでスタート!?
きっかけ①
2023年も終わりかけの12月下旬。
たまたまMicrosoft(マイクロソフト)のcopilot(コパイロット)でchatGPT4(チャットジーピーティーフォー)、
Dall-E3(ダリスリー)が使えることを知る。
(なーんて横文字並べてカッコよく書いてるが、
この時点ではDall-E3の読み方すら知らなくて調べた記憶がある)
Microsoftは5日(米国時間)、生成AIを使ったCopilot(コパイロット)のアップデートを発表。今後数週間で、OpenAIの最新モデルであるGPT-4 Turboに対応し、より複雑で長いタスクに対応するほか、新たなDALL-E 3モデルの更新やコード出力の改善などを図る。
早速copilot(コパイロット)をちょっとだけ触ってみたところ
画像生成AIの簡単さとクオリティに驚いて、
これなら何か出来るかもしれないと思う。
調べてみるとどうやらStableDiffusion(ステーブル・ディフュージョン)が
画像生成AIのスタンダードである事を知る。
ただStableDiffusion(以下、SD)には有料と無料があり
「何かやるならそれなりの数作るし、
たくさん作るなら無料しかないでしょ」
という事で無料で生成できるSDwebUIをPCにインストールする事に。
(後から知ったけどmacでは動かない的な記事を複数見つけ
ちょっと前まではmacでは動かせなかった事、
今でも基本はwinじゃないと無理な事を知らなかったのは不幸中の幸い。
(自分の性格上、先に知っちゃたらmacユーザーの自分には
無理と諦めて何もやらなかったろう))
初めてmacのターミナルを触ってちょこちょこ動かして
(と言っても4つか5つコードを貼り付けて動かしただけだけど)
1時間くらいで無事インストール&画像生成に成功。これが12/19。
Stable Diffusionを初めて触ってみる。これからどうなることやら。#StableDiffusion
— MIYABI×AI (@miyabi3_AI) December 19, 2023
そこから年末年始はお金もないのであまり出かけず
ずっと「SDの使い方」並びに
「LINEスタンプに使えそうな&同じテイストの画像を出す」ため
ひたすらPCと睨めっこ。
Stable DiffusionをPCに入れてみたものの、そこから先なかなか進まない。というのも、基本はWinでやるものだというのを知らずにMacでなんとかやれる方法を調べて調べて調べて・・・。基礎知識が無さすぎてすっごい時間かかってるんだが。
— MIYABI×AI (@miyabi3_AI) December 25, 2023
いつになったらちゃんと絵を作れるんだろう- -;
きっかけ②
正月三ヶ日も終わろうとしていた頃、
SDの限界(というか今調べて自分ができるところの限界)が来て、
他の画像生成AIはどうかと
もう一度Microsoft copilotで作ってみたら
こっちの方がイメージに近いものがサラッと出てきた。
(この10日間はなんだったんだ!?)
ただcopilotはSDのように細かい設定ができないから
そんな中で何とか同じような画像を出す方法を探してたら
Dall-E3でSEED値※を指定する方法をweb &YouTubeで見つける。
※画像生成AIにおいて、シード値(seed値)とは、乱数生成の初期値のことを意味しています。(中略)シード値を指定すると、乱数生成器が常に同じ数列を生成するため、結果として同じ画像を再現できるようになります。
ただMicrosoft copilotのDall-E3では上手くできない
(SEED値が出てこない)ので、
ここでようやく本家chatGPT側でやってみる事に。
これが1/3の夜。
何とかやり方を見つけたとは言え、簡単にできるわけでもなく、
一生懸命やるがなかなか上手くいかない。
それでもSDよりはやっぱりイメージに近いものが出るので
何とかスタンプ画像っぽいものをいくつか作成。
![](https://assets.st-note.com/img/1704870366558-TARVSU8Cdb.png?width=800)
きっかけ③
引き続きSDとかDall-E3とかのやり方を調べてたけど
『結局プロンプトが大事なんじゃないか』ってことで、
プロンプトの基礎を学ぼうと調べたところ
プロンプトエンジニアリングという言葉を知る。
そこから正味3時間。
何やかんや調べているうちにGPTsの存在を知り、
GTPsの可能性を知り、できそうな感じを大いに受ける。
2023年、生成AIの流れ
自分がこの1ヶ月弱でここに辿り着いたきっかけを書いたけど、
そもそもこの業界の去年1年の流れを軽くまとめてみる。
2023年はAI元年と言われるが、
それでも諸々充実したのは年の後半、もう寒くなった時期。
・『GTP-4』こそ3/14と春の時期だが
・高精細の『SDXL1.0』が使えるようになったのは7/27。
ましてそれがmacで行けるようになったのは8月終わりだか、
それより後っぽい。
・画像生成の『Dall-E3』が9/20
・画像を読み込むことができる『GPT-4V』が 9/25
・『GPT-4Turbo』が11/6
・Microsoft copilotの『GTP-4・Dall-E3アップデート』が12/5。
(このアップデート&ニュースキャッチでcopilot版Dall-E3を
試用してなければ、chatGPTを触ることもなかったろう)
・Geminiが12/6に発表。
・そして『GPT Store』は2024年1月の今週という絶妙のタイミング。
米OpenAIは1月4日、ノーコードで開発した生成AIアプリ「GPTs」を公開できるアプリストア「GPT Store」を9日の週に立ち上げると、GPTsを公開済みの「ビルダー」にメールで通知した。GPT Storeは昨年11月に開店の予定だったが、CEO解任から始まった一連の騒動で遅れていた
こんな流れは今調べて知った話で、1ヶ月前には全くわかってなかった。
自分のことだけじゃなく、この環境もなんだか絶妙なタイミング。
スタートに向けて
今まで「あー、もっと早く知ってれば」と何度思ったか。
未だに検索エンジンで上手く検索できない人が山ほどいる中で、
プロンプトエンジニアリングだけじゃなく、
GPTsまで先行者として出来たらこれほどすごいことないじゃない。
これは絶対にチャンス!
年末からここまでの流れ。完璧に導かれてる!
あとは自分で限界決めず信じてやり切る!
ということで、やっていきます。笑
この記事が気に入ったらサポートをしてみませんか?