見出し画像

すごいタイミングでスタート!?

きっかけ①

2023年も終わりかけの12月下旬。
たまたまMicrosoft(マイクロソフト)のcopilot(コパイロット)でchatGPT4(チャットジーピーティーフォー)、
Dall-E3(ダリスリー)が使えることを知る。
(なーんて横文字並べてカッコよく書いてるが、
この時点ではDall-E3の読み方すら知らなくて調べた記憶がある)

 Microsoftは5日(米国時間)、生成AIを使ったCopilot(コパイロット)のアップデートを発表。今後数週間で、OpenAIの最新モデルであるGPT-4 Turboに対応し、より複雑で長いタスクに対応するほか、新たなDALL-E 3モデルの更新やコード出力の改善などを図る。

Microsoft Copilot、GPT-4 Turbo対応やDALL-E 3更新など大幅強化

早速copilot(コパイロット)をちょっとだけ触ってみたところ
画像生成AIの簡単さとクオリティに驚いて、
これなら何か出来るかもしれないと思う。

調べてみるとどうやらStableDiffusion(ステーブル・ディフュージョン)が
画像生成AIのスタンダードである事を知る。

ただStableDiffusion(以下、SD)には有料と無料があり

「何かやるならそれなりの数作るし、
たくさん作るなら無料しかないでしょ」

という事で無料で生成できるSDwebUIをPCにインストールする事に。
(後から知ったけどmacでは動かない的な記事を複数見つけ
ちょっと前まではmacでは動かせなかった事、
今でも基本はwinじゃないと無理な事を知らなかったのは不幸中の幸い。
(自分の性格上、先に知っちゃたらmacユーザーの自分には
無理と諦めて何もやらなかったろう))

初めてmacのターミナルを触ってちょこちょこ動かして
(と言っても4つか5つコードを貼り付けて動かしただけだけど)
1時間くらいで無事インストール&画像生成に成功。これが12/19。

そこから年末年始はお金もないのであまり出かけず
ずっと「SDの使い方」並びに
「LINEスタンプに使えそうな&同じテイストの画像を出す」ため
ひたすらPCと睨めっこ。

きっかけ②

正月三ヶ日も終わろうとしていた頃、
SDの限界(というか今調べて自分ができるところの限界)が来て、
他の画像生成AIはどうかと
もう一度Microsoft copilotで作ってみたら
こっちの方がイメージに近いものがサラッと出てきた。
(この10日間はなんだったんだ!?)

ただcopilotはSDのように細かい設定ができないから
そんな中で何とか同じような画像を出す方法を探してたら
Dall-E3でSEED値※を指定する方法をweb &YouTubeで見つける。

※画像生成AIにおいて、シード値(seed値)とは、乱数生成の初期値のことを意味しています。(中略)シード値を指定すると、乱数生成器が常に同じ数列を生成するため、結果として同じ画像を再現できるようになります。

DALL-E 3の画像IDとシード値の仕組み

ただMicrosoft copilotのDall-E3では上手くできない
(SEED値が出てこない)ので、
ここでようやく本家chatGPT側でやってみる事に。
これが1/3の夜。

何とかやり方を見つけたとは言え、簡単にできるわけでもなく、
一生懸命やるがなかなか上手くいかない。
それでもSDよりはやっぱりイメージに近いものが出るので
何とかスタンプ画像っぽいものをいくつか作成。

SEED値を指定して生成した猫の画像

きっかけ③

引き続きSDとかDall-E3とかのやり方を調べてたけど
『結局プロンプトが大事なんじゃないか』ってことで、
プロンプトの基礎を学ぼうと調べたところ
プロンプトエンジニアリングという言葉を知る。
そこから正味3時間。
何やかんや調べているうちにGPTsの存在を知り、
GTPsの可能性を知り、できそうな感じを大いに受ける。

2023年、生成AIの流れ

自分がこの1ヶ月弱でここに辿り着いたきっかけを書いたけど、
そもそもこの業界の去年1年の流れを軽くまとめてみる。

2023年はAI元年と言われるが、
それでも諸々充実したのは年の後半、もう寒くなった時期。

・『GTP-4』こそ3/14と春の時期だが

・高精細の『SDXL1.0』が使えるようになったのは7/27。
ましてそれがmacで行けるようになったのは8月終わりだか、
それより後っぽい。

・画像生成の『Dall-E3』が9/20

・画像を読み込むことができる『GPT-4V』が 9/25

・『GPT-4Turbo』が11/6

・Microsoft copilotの『GTP-4・Dall-E3アップデート』が12/5。
(このアップデート&ニュースキャッチでcopilot版Dall-E3を
試用してなければ、chatGPTを触ることもなかったろう)

・Geminiが12/6に発表。

・そして『GPT Store』は2024年1月の今週という絶妙のタイミング。

米OpenAIは1月4日、ノーコードで開発した生成AIアプリ「GPTs」を公開できるアプリストア「GPT Store」を9日の週に立ち上げると、GPTsを公開済みの「ビルダー」にメールで通知した。GPT Storeは昨年11月に開店の予定だったが、CEO解任から始まった一連の騒動で遅れていた

OpenAI、開発したオリジナル「GPTs」を公開できる「GPT Store」開店へ

こんな流れは今調べて知った話で、1ヶ月前には全くわかってなかった。
自分のことだけじゃなく、この環境もなんだか絶妙なタイミング。

スタートに向けて

今まで「あー、もっと早く知ってれば」と何度思ったか。
未だに検索エンジンで上手く検索できない人が山ほどいる中で、
プロンプトエンジニアリングだけじゃなく、
GPTsまで先行者として出来たらこれほどすごいことないじゃない。
これは絶対にチャンス!
年末からここまでの流れ。完璧に導かれてる!
あとは自分で限界決めず信じてやり切る!

ということで、やっていきます。笑

この記事が気に入ったらサポートをしてみませんか?