マガジンのカバー画像

気になる生成AI記事まとめ

4
運営しているクリエイター

記事一覧

LLMプロンプトの26原則

LLMプロンプトの26原則

12月26日に公開されたプレプリント"Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4"、そのGithubのプロジェクトページより、26個のLLMプロンプト・プリンシパル(原則)をその5カテゴリごとに共有します。

5カテゴリ:

Ⅰ. プロンプトの構成と明快さ

Ⅱ. 具体性と情報

Ⅲ.

もっとみる
Midjourney V6とV5はまったく別のもの! 大半のプロンプトは共有できない - Blog 2023/12/21

Midjourney V6とV5はまったく別のもの! 大半のプロンプトは共有できない - Blog 2023/12/21

Midjourney Model V6 (alpha) が利用可能になったので、試してみました。
さすがに(今後、仕様が変更される可能性がある)アルファバージョンの検証はできないので、ファーストインプレッションのみ書き留めておきたいと思います。

Midjourney Model V6 (alpha)

これはアルファテストです。仕様は予告なく変更される可能性があります。
アルファバージョンでのプ

もっとみる
『アクセンチュア、生成AIで広告制作自動化。広告はAIが作る時代に』~【web3&AI-テックビジネスのアイディアのタネ】2023.12.25

『アクセンチュア、生成AIで広告制作自動化。広告はAIが作る時代に』~【web3&AI-テックビジネスのアイディアのタネ】2023.12.25


■アクセンチュア、生成AIで広告制作自動化 代理店と競合生成AIは広告など購買促進にとても相性がいいと言われていました。

・消費者ひとりひとりに、好みに合った違うクリエイティブを生成することができる。
・「フェイク動画」の技術を使い、推しが商品を薦めるCMが推し本人の稼働なしで生成できる。
・広告の応答度合いのログにリアルタイムに連動して広告クリエイティブをどんどん効果的に自動チューニングでき

もっとみる
Gemini Pro APIの活用 : Hey Gemini! 音声起動による対話型マルチモーダルAIアプリ開発

Gemini Pro APIの活用 : Hey Gemini! 音声起動による対話型マルチモーダルAIアプリ開発

プログラムの概要このプログラムは、音声入力の録音とテキストへの変換、AIによる応答生成、生成されたテキストの音声への変換、画像処理を組み合わせた複合的な機能を提供します。目的は、ユーザーからの音声入力に対して、AIが適切に応答し、その応答を音声として出力することです。最終的にはDeepmindのDemoを目指しています。

こちらの記事の続きです。

プログラムの主要機能ウェイクワードの検出:

もっとみる