#人工知能
Google Colab で Stable Video Diffusion を試す
「Google Colab」で「Stable Video Diffusion」を試したのでまとめました。
【最新版の情報は以下で紹介】
1. Stable Video Diffusion「Stable Video Diffusion」は、「Stability AI」が開発した画像から動画を生成するAIモデルです。
2. Stable Video Diffusion のモデル現在、2つのモデル
ChatGPTとDALL-E 3にオリジナルの絵本を描いてもらおう
ChatGPTに導入されたDALL-E 3は、工夫によって、様々な使い方ができます。今回は、ChatGPTの文章生成機能と合わせて、オリジナルの絵本を描いてもらうことにしました。
1.ひみつのケーキ屋さん(1) ストーリーの作成
まず最初に、ChatGPTにオリジナルのストーリーを書いてもらいます。
(2) シーンの分割
10枚の絵で構成された絵本を作成するために、ストーリーを10個のシー
DALL-E 3 with ChatGPTの特徴と面白い使い方
OpenAIが9月20日に発表した新画像生成AIのDALL-E 3がついに筆者のところにもやって来ました。
そこで、ChatGPTに統合されたDALL-E 3に何ができるのか、実際に試してみました。
1.DALL-E 3の特徴このDALL-E 3の主な特徴は以下の2点です。
複雑なプロンプトにも忠実で正確な画像を生成できる。
ChatGPTとの対話を踏まえて画像を生成することができる。
C
新画像生成AIのDALL-E 3は何ができるのか?
9月20日に、OpenAIが新画像生成AIのDALL-E 3を発表しました。
DALL-E 3はChatGPT上で使用することができ、10月初旬に有料のChatGPT PlusとEnterpriseのユーザーに提供される予定です。
今回、このDALL-E 3は何ができるのかについて解説します。
1.DALL-E 3の概要(1) DALL-E 3の特徴
DALL-E 3は、OpenAIが202
最近話題の音生成AIまとめ
最近話題の音生成AIをまとめました。
1. AudioCraft「AudioCraft」は、Metaが開発した、深層学習によるオーディオ処理と生成のためのライブラリです。次の3つのモデルが含まれています。
2. AudioLDM 2「AudioLDM 2」は、テキストから音声、音楽、効果音などあらゆる種別のオーディオを生成するAIです。「AudioLDM 2」では、オーディオを「LOA」(La
Metaのサウンド生成ツール「Audio Craft」の使い方
8月2日、Metaがテキストから音楽や効果音を生成するAIツール「Audio Craft」を発表したので試してみました。
1.Audio Craftの概要Audio Craftは、以下の3つのモデルで構成されたオープンソースのサウンド生成ツールです。
AudioGen テキストから効果音などを生成
MusicGen テキストから音楽を生成
EnCodec ニューラルネットワークベースの音声
生成 AI を使ってじょしちゅうがくせを創って自分もじょしちゅうがくせいになって会話した話(3)じょしちゅうがくせい生成編-1
前回までのあらすじ画期的な音声変換手法の登場とそれを誰でも使える様にアプリケーション化してくれた神々のおかげで、大した苦労もなくじょしちゅうがくせいに成れてしまった。
これまでの記事:
生成 AI を使ってじょしちゅうがくせを創って自分もじょしちゅうがくせいになって会話した話(1)概要編
生成 AI を使ってじょしちゅうがくせを創って自分もじょしちゅうがくせいになって会話した話(2)じょしち