Googleは新機能「SGE」を発表し、テキストプロンプトから直接画像を生成することができるようになりました。この機能は「Imagin」というテキストから画像への拡散モデルに基づき、Googleの大規模言語モデル「LaMDA」で動作します。ユーザーは100以上の言語で指示を入力し、さまざまな画像スタイルを選択することができます。SGEは他のAIツールに比べて優れており、Google検索に統合されています。ただし、まだ実験的な段階にあり、制限や注意点が設けられています。
公開日:2023年10月14日
※動画を再生してから読むのがオススメです。
さて、Googleはテキストプロンプトを使用して検索バーから直接画像を生成できる新機能を発表しました。
これは彼らの検索生成体験(SGE)イニシアティブの一部で、検索をよりクリエイティブにすることを目指しています。
SGEはimaginというテキストから画像への変換モデルを搭載しており、テキストを深く理解してリアルな画像を生成します。
ImaginはGoogleのLaMDAで動作し、自然な会話言語を扱う大規模な言語モデルです。
今、SGEは100以上の言語に対応しており、お好きな言語を自由に使用できます。
画像のアスペクト比を選択したり、正方形、縦長、または横長のような異なるスタイルの画像を選択したりするオプションがあります。
たとえば、巨大なコーンのヘビで構成された農場の絵を作成したい場合、詳細を検索バーに入力してエンターキーを押すだけです。
生成された画像は、AIモデルがプロンプトをどれだけ理解してリアルなコーンヘビを典型的な農場の背景に生成したかを示します。
生成された画像は、AIモデルがプロンプトをどれだけうまく把握しているかを示しており、典型的な農場の風景の中で現実的なコーンヘビが生成されています。
もしも画像を変更したい場合、例えば蛇を青くしたり、農場を冬景色に描いたりする場合は、簡単です。
クエリで詳細を追加または変更するだけです。
たとえば、「巨大な青いコーンのヘビが農場で冬に作られ、ヘビはコーンでできています」と入力すると、新しい画像が表示され、青いヘビと雪が積もった農場が表示され、コーンの質感が保たれます。
SGEは画像生成においてかなりの制御と柔軟性を提供します。
言葉の選択は完全にあなた次第であり、AIモデルはあなたの説明に合った画像を生成することを目指しています。
SGEは画像を作成するための他のAIツールに対してどのように立ち向かうのでしょうか?
マイクロソフトのBingイメージクリエーターのDALL·E 3や、Stable Diffusionを使用したMidjourney、DALL·E Miniを使用したCrayon、Dream by Womoを使用したNight Cafeなど、すべてが独自のAIメソッドを使用してテキストを画像に変換しています。
それぞれに長所と短所があります。
たとえば、Bing画像生成は使いやすく、作成した画像を簡単に変更できます。
Midjourneyは高品質の画像を提供し、多言語で動作します。
Crayonは簡単で迅速に使用でき、画像を無料でダウンロードできます。
Night Cafeは音楽を使用して画像をアニメーション化する楽しい要素を追加できます。
最後に、Do Eは複雑なプロンプトに対処できる強力なモデルを持っています。
ただし、SGEにもこれらのツールに対するいくつかの利点があると思います。
まず第一に、それはGoogle検索の一部であるため、別個のアプリやウェブサイトは必要ありません。
通常通りブラウザにクエリを入力するだけです。
第二に、SGEはimaginという高度なテキストから画像への変換モデルを使用して、言語をよく理解したリアルな画像を生成します。
ImaginはGoogle検索結果を含むオンラインで見つかる大量のテキストと画像から学習するため、情報を豊富に持っています。
また、マルチモーダルクエリを処理でき、リクエストにテキスト、画像、絵文字を混在させることができます。
この方法で、詳細な説明に基づいて非常に詳細かつリアルな画像を得ることができます。
第三に、SGEはGoogleのAIチャットボットであるBardと連携し、Bardとチャットしながら画像を生成できます。
そして今、BardにSGE内での文章の起草を手伝ってもらうことができます。特定のトピックに関する記事のリクエストをしたり、SGEが関連する画像を提供したりすることができます。
BardとSGEの組み合わせは、コンテンツクリエーターやライター、またはアシスタンスやインスピレーションを求めている学生にとって大きな助けになるかもしれません。
SGEを使い始める前に、いくつかの重要なことを知っておくことが重要です。
まず第一に、SGEは実験的な段階にあるため、いくつかのバグやエラーが発生する可能性があります。
AIが常にあなたのリクエストを理解するわけではないか、またはイメージを想像通りに生成しない可能性もあるため、フィードバックとデータの持続的な改善が行われています。
第二に、SGEは誤用を防ぐための措置を講じています。
有害、攻撃的、または誤解を招く可能性のある画像は生成しません。
また、許可なく人物の顔や有名人のリアルな画像を生成しません。これはプライバシーを守り、誤った情報を防ぐためです。
第三に、SGEには画像の出典を示すためのラベリングとウォーターマーキングの機能が含まれており、透明性と責任を促進します。
画像をホバーまたはクリックすることで、画像を作成するために使用されたテキストプロンプトを確認できます。
最後に、18歳以上のみがSGEを使用できます。生成されるコンテンツの一部は若年のユーザーには適していない可能性があるため、親の監督が必要かもしれません。
これらのポイントを知っておくことは、SGEを使用する際に役立ちます。
このビデオが必要な情報を提供できれば幸いです。
お楽しみいただければ、いいねとチャンネル登録をお願いします。
SGEやそれで作成しようとしている画像の種類についてのご意見を、以下のコメントでお聞かせください。
ご視聴いただき、ありがとうございました。次回もお会いしましょう。