
【動画生成AI】 Runway Gen-3 Alpha + Evelenlabs + Canva + ChatGPT + Claude 3.5 Sonnetでショートムービー制作!


アイデア出しや台本作成をClaude 3.5 Sonnet、動画をRunway Gen-3 Alpha、Runway Gen-3用のプロンプト作成をChatGPT、ナレーションをElevenlabs、それらの素材を組み合わせて動画への成形にCanvaを利用しました。私は動画制作の初心者なので、同じく初心者の方でも上記の動画を作れるようになります。

1. 使用するツール

Claude 3.5 Sonnet

Claude 3.5 Sonnetは、Anthropic社が開発した最新の大規模言語モデルです。高度な自然言語処理能力を持ち、創造的なアイデア出しや台本作成に優れています。ユーザーの意図を理解し、多様なジャンルやスタイルに対応した魅力的なコンテンツを生成できます。


ChatGPTは、OpenAI社が開発した大規模言語モデルを基にしたAIチャットボットです。GPT(Generative Pre-trained Transformer)アーキテクチャを使用しており、自然言語処理と生成において高い能力を持っています。Claudeと同様に、こちらも無料で使用することができます。回数制限が有料ユーザーより厳しくなっているので、使い過ぎには注意が必要です。
ChatGPTでは、カスタマイズしたGPTを作成することができます。今回は、Runway Gen-3 Alpha用のプロンプトを生成するGPTを利用します。

Runway Gen-3 Alpha

Runway Gen-3 Alphaは、最先端のAI動画生成ツールです。テキストプロンプトから高品質な動画を作成することができ、様々なスタイルや雰囲気の映像を生成可能です。既存の動画を編集したり、新しい動画を一から作成したりすることができ、クリエイティブな表現の幅を大きく広げます。

最新モデルのGen-3 Alphaを使用するには課金が必要です。最低でも月額15ドルのStandardプランへの加入が必要です。
Standardプランの場合、毎月625クレジットが付与されます。Gen-3 Alphaでの動画生成で使用するクレジットは、5秒の動画で50クレジット、10秒の動画で100クレジットになります。Standardプランでは、毎月60秒までの動画しか生成できないことをご留意ください。

Runway 料金表







Canvaは、無料で使用できる範囲が広いです。動画の作成も無料で行うことができます。無料の場合、Pro版の素材を利用できない、1080p (1920x1080)の解像度でしかダウンロードできないという制限があります。より高画質の動画としてダウンロードしたい、無料素材では足りない場合は、課金をご検討ください。

2. Claudeでアイデア出し+台本制作





1. **時空を超えた対話**
   - 歴史上の偉人たちが現代の問題について議論する様子を描きます。例えば、レオナルド・ダ・ヴィンチ、アインシュタイン、孔子が環境問題や人工知能の倫理について語り合う場面を作成します。AIを使って各人物の外見や声を再現し、ディープフェイク技術で自然な会話を演出します。

2. **感情の可視化**
   - 人間の感情を抽象的な映像として表現します。例えば、喜び、悲しみ、怒り、恐れなどの感情を、色彩や形、動きで表現し、それらが互いに影響し合い、変化していく様子を描きます。AIを使って感情と視覚表現をマッピングし、流動的なアニメーションを生成します。

3. **未来都市の一日**
   - AIが想像する100年後の都市の姿を24時間のタイムラプスで表現します。空飛ぶ車、ホログラム広告、環境に優しい建築物など、未来的な要素を盛り込みながら、朝から夜までの都市の変化を描きます。AIによる未来予測と3DCG生成を組み合わせて制作します。

4. **音楽の視覚化**
   - クラシック音楽の名曲を視覚的に表現します。例えば、ベートーベンの第九交響曲を、音の強弱や和音の変化に合わせて、抽象的な形や色彩が変化する映像として表現します。AIを使って音楽を分析し、それに対応する視覚要素を生成します[1]。

5. **自然の神秘**
   - 微生物の世界や、宇宙の果ての現象など、肉眼では見ることのできない自然の神秘を、AIの想像力を駆使して視覚化します。例えば、細胞分裂の過程や、ブラックホールの事象の地平線付近の様子を、科学的知見に基づきながらも芸術的に表現します。

6. **言語の進化**
   - 人類の言語の進化を視覚的に表現します。古代の象形文字から現代の文字、さらには未来の通信方法まで、言語の形態変化を動的なアニメーションで表現します。AIを使って文字の形状を生成し、その変化を滑らかにつなげます。

7. **夢の中の旅**
   - 人間の夢の中を旅するような映像を制作します。現実と非現実が入り混じり、シーンが突然変わったり、物体が変形したりする不思議な世界を表現します。AIの画像生成能力を活用し、シュールでありながら美しい映像を作り出します[2]






# The Evolution of Language: A History of Human Communication

**Prologue (20 seconds)**
Space. Countless stars form the double helix structure of DNA.
Narration: "Our story is etched in the stars. The birth of language began with the pulse of the universe."
The DNA transforms into a human shape. Tears fall from its eyes, forming the Earth.
Narration: "And that pulse was passed on to the Earth, to humanity, and to words."
Sound effects: Cosmic music, heartbeat

**Act 1: The First Words (40 seconds)**
Primitive Earth. Early humans gathered around a fire in a cave.
Narration: "The first word was probably a cry. Fear, joy, warning—emotions became sounds that shook the air."
One person opens their mouth and makes a sound. Others turn in surprise.
Narration: "In that moment, the world changed. Sounds gained meaning, and meaning became shared."
Handprints appear on the cave wall, followed by a bison painting. The painting comes to life, depicting a hunting scene.
Narration: "And so, humanity acquired the power to tell stories. To record the past and imagine the future—words became wings that transcended time."
Sound effects: Wind, crackling fire, primitive drum rhythms

**Act 2: Dawn of Civilization (50 seconds)**
Egyptian pyramid construction site. Workers calling to each other as they move stones.
Narration: "As civilization developed, words took form. Voices were carved in stone, aiming for eternity."
Hieroglyphs appear on the wall.
Narration: "Pictographs abstracted the visible world, becoming tools to convey thought."
Scene changes to Mesopotamia, with cuneiform being inscribed on clay tablets.
Narration: "Writing continued to evolve, capable of expressing increasingly complex concepts."
Phoenician port town, merchants using alphabets for trade.
Narration: "With the birth of the alphabet, words prepared for a journey."
Letters move across a map, spreading east and west along the Silk Road.
Narration: "Languages spread with cultures, encountering new ideas and evolving further."
Chinese characters emerge, then travel to Japan where kana develops.
Narration: "In the East, the characters themselves became art, and words were clothed in beauty."
Sound effects: Construction sounds, brush writing, port bustle

**Act 3: Wings of Knowledge (40 seconds)**
Medieval monastery. Monks carefully copying text onto parchment.
Narration: "For a long time, knowledge was the privilege of the few. Words became power, sometimes a tool of oppression."
Gutenberg's printing press appears. Books are produced one after another.
Narration: "But technological progress gave words new wings. With the invention of printing, knowledge was liberated."
Library scene. People eagerly reading books.
Narration: "Books became treasure troves of knowledge, opening new worlds in people's minds."
Newspapers and magazines appear, information spreading to the masses.
Narration: "The democratization of information began, and words gained the power to change society."
Sound effects: Quill pen writing, printing press operation, pages turning

**Act 4: Electronic Words (45 seconds)**
20th century telegraph. Morse code signals race around the world.
Narration: "The Industrial Revolution brought revolution to words as well. An era arrived where words clothed in electricity circled the globe in an instant."
Invention of the telephone. Voices traveling far along wires.
Narration: "Distance became powerless before words. Voices began to resound across time and space."
Computers appear. Programming languages show on the screen.
Narration: "And then, words became logic, gaining the power to move machines. The dialogue between humans and machines began."
Explosive spread of the Internet. Information from around the world connecting.
Narration: "With the birth of the Internet, words flew freely, crossing borders and fusing cultures."
Smartphone screen. Posts in various languages flying back and forth on social media.
Narration: "An era where we connect instantly with the world at our fingertips. Individual voices now resound on a global scale."
Sound effects: Telegraph sounds, dial tones, keyboard typing, notification sounds

**Act 5: AI Language Revolution (40 seconds)**
Voice recognition waveforms appear, converting into multilingual text.
Narration: "In the 21st century, artificial intelligence opened new horizons for language. An era began where machines understand and respond to human speech."
Real-time translation between different languages.
Narration: "Language barriers began to crumble. The day approaches when people worldwide can converse freely in their mother tongues."
AI poet generating poetry, collaborating with a human poet.
Narration: "AI acquired creativity and began co-creation with humans. The possibilities of language were led to even greater heights."
Project to database and preserve endangered languages.
Narration: "Simultaneously, we began efforts to protect past languages. The challenge continues to save disappearing languages and maintain diversity."
Sound effects: AI processing sounds, poetry recitation, minority ethnic songs

**Act 6: The Future of Language (45 seconds)**
Brain wave patterns displayed, showing direct thought transmission.
Narration: "The future of language is filled with endless possibilities. A day may come when brain connects directly with brain."
Cross-cultural exchange in virtual space. Communication transcending language barriers.
Narration: "In virtual spaces, new communities are emerging that transcend differences in language and culture."
In outer space, a message from extraterrestrial intelligent life glows.
Narration: "And someday, we may encounter unknown words from beyond the stars."
Creation of a universal language composed of equations and music.
Narration: "Humanity's dream is to create a universal language that reflects the truth of the universe. That challenge has only just begun."
Sound effects: Futuristic electronic sounds, signals from space

**Epilogue (20 seconds)**
Various characters, symbols, and voices swirl, reforming into a human shape.
Narration: "Words are our very history. They reflect the past, shape the present, and point to the future."
That figure splits into countless parts, spreading into the universe as stars.
Narration: "We evolve with words and spread into the universe. The story of language continues eternally."
Sound effects: Grand orchestral climax, fade out


3. Gen-3で動画作成



- Space. Countless stars form the double helix structure of DNA.


Slow zoom: Vast, deep space. Countless stars twinkling, slowly forming a DNA double helix structure. The light of the stars pulsates as the helix rotates gracefully. Colors shift from deep blue to purple in a gradient.

このプロンプトで動画を生成します。Runway Gen-3 Alphaにアクセスし、Gen-3での動画生成画面を開いてください。以下のような画面が表示されるので、左上のプロンプト入力部に先ほどのプロンプトを入力し、下部の動画の長さの設定箇所で"10秒"を設定し、最後に"Generate"ボタンを押下します。


4. Elevenlabsでナレーション作成


  • Elevenlabsにアクセスし、以下の画面を開きます。

  • 左メニューから"Speech"を選択すると、スピーチ内容を設定する画面が開きます。

  • 中央のタブは、"TEXT TO SPEECH"を選択し、読ませたいテキストを入力します。

  • 中央のテキスト入力箇所の左下から声を選択できます。好みの声を選択してください。

  • 声の選択箇所の右隣の"Settings"を選択すると、細かい調整が可能です。

  • 最後に"Generate speech"ボタンを押下すると、下部に音声が生成されます。

  • 右下のダウンロードボタンを押下し、音声をダウンロードしてください。


5. Canvaで動画に成形


  • Canvaにアクセスし、以下の画面を開きます。

  • 上部のデザインの種類から"動画"を選択し、その下に表示される動画の種類から"Youtube動画”を選択します。

  • 動画の編集画面が表示されます。

  • 左サイドメニューから"アップロード"を選択します。

  • 左サイドメニューの右隣に今までにアップロードされた素材が表示されます。この上部の"ファイルをアップロード"ボタンを押下し、Gen-3で生成した動画を選択します。

  • キャンバスの中央にアップロードしたファイルが表示されます。

  • 動画を右クリックし、"動画を背景として設定"を選択すると、動画がキャンバス全体に表示されるようになります。

  • 新たに動画を追加するために、下部の"+"マークの箇所を選択します。

  • 新たにキャンバスが追加されるので、同様に動画を追加していきます。

  • キャンバスとキャンバスの間にマウスを移動させると、新たにキャンバスを追加する"+"ボタンと、トランジション(画面遷移時のエフェクト)を選択するボタンが表示されます。

  • トランジションのボタンを選択すると、左にトランジションの種類が表示されます。好みのトランジションを選択してください。

  • 次に音声をアップロードします。動画と同様に左メニューからアップロードを選択し、"ファイルをアップロード"ボタンを押下し、音声をアップロードしてください。

  • 左のアップロードした音声一覧から、キャンバスに追加したい音声をドラッグし、キャンバスに近づけると、下部に"音楽をドロップ"と表示されるので、動画の好きな箇所に音声を配置します。

  • 次にBGMを追加します。左サイドメニューから"オーディオ"を選択すると、オーディオの選択画面が右隣に表示されます。

  • 表示された画面上部の検索バーに欲しい音楽の内容を入力すると、その内容に合ったオーディオが下部に表示されます。

  • 音声を追加した時と同様に、BGMを追加します。

  • 動画編集が完了したら、完成した動画をダウンロードします。右上の"共有"ボタンを押します。

  • 表示されたメニューから"ダウンロード"を選択します。

  • 動画の形式を選択する画面が表示されます。

  • ファイルの種類は"MP4形式の動画”を選択します。

  • ページを選択では、"すべてのページ"を選択します。

  • 最後に"ダウンロード"ボタンを押下すると、動画のダウンロードが開始します。

6. 映像が完成!



