見出し画像

ソラ OpenAI、目を見張るような動画を瞬時に生成するAIを発表

Modern diplomacy
ニュースルーム
2024年2月24日

元記事はこちら。

ニューヨークのスタートアップ企業『ランウェイAI』は4月、コンピューター画面のボックスに文章を入力するだけで、誕生日パーティーの牛やスマートフォンでおしゃべりする犬のような動画を生成できる技術を発表した、と『ニューヨーク・タイムズ』紙は書いている。

その4秒間の動画は、不鮮明で、途切れ途切れで、歪んでいて、不穏なものだった。 しかし、人工知能技術が今後数カ月、数年のうちに、ますます説得力のある動画を生成するようになることを明確に示していた。

それからわずか10カ月後、サンフランシスコの新興企業OpenAIは、ハリウッド映画から抜粋したかのような動画を作成する同様のシステムを発表した。 デモでは、雪の草原をトコトコと歩くマンモスや、溶けたロウソクを見つめる怪物、東京の街並みを急降下するカメラで撮影したかのような映像などが、数分で作成された短い動画で紹介された。

チャットボット「ChatGPT」や静止画ジェネレーター「DALL-E」を開発したOpenAIは、ランウェイのような新興企業や、グーグルやフェイスブックやインスタグラムを運営するメタのような技術大手など、この種のインスタント動画ジェネレーターを改良しようと競争している多くの企業のひとつである。 このテクノロジーは、ベテランの映画制作者の仕事をスピードアップさせ、経験の浅いデジタル・アーティストに完全に取って代わる可能性がある。

また、ネット上の偽情報を迅速かつ安価に作成する手段となり、インターネット上で何が真実かを見分けることがさらに難しくなる可能性もある

ワシントン大学の教授で、人工知能を専門とするオーレン・エツィオーニ氏は、「このようなことが、僅差で争われる選挙を揺るがすことになるとは、絶対に恐ろしいことだ」と語る。 彼はまた、政治キャンペーンにおけるネット上の偽情報の特定に取り組む非営利団体、トゥルー・メディアの創設者でもある。

OpenAIはその新しいシステムを、日本語の「空」にちなんで「Sora」と呼んでいる。 研究者のティム・ブルックスとビル・ピーブルズを含むこの技術を支えるチームは、「無限の創造的可能性を連想させる」という理由でこの名前を選んだ。

インタビューの中で、彼らはまた、システムの危険性を理解するために取り組んでいる最中であるため、同社はまだSoraを一般に公開していないと述べた。 その代わりに、OpenAIはこの技術を少人数の学者やその他の外部研究者と共有し、「レッドチーム」(悪用される可能性のある方法を探すための用語)を行う予定だ。

「ここでの意図は、人々にこの技術の能力を知ってもらい、フィードバックを得ることです」とブルックス博士は言う。

このシステムはジェネレーティブA.I.の一例で、テキスト、画像、音声を瞬時に作成することができる。 他のジェネレーティブA.I.テクノロジーと同様、オープンエイのシステムはデジタルデータ(この場合は動画と、その動画に含まれる内容を説明するキャプション)を分析することで学習する。

オープンAIは、一般に公開されている動画と著作権者からライセンスを受けた動画の両方を学習させたということ以外、システムが学習した動画の数や、その動画の出所については明言を避けた。 同社は、自社の技術を学習させるために使用したデータについてほとんど語らないが、それはおそらく競合他社よりも優位性を保ちたいからだろう。

『DALL-E』、『Midjourney』、その他の静止画ジェネレーターは、ここ数年で急速に進歩し、今では写真とほとんど見分けがつかない画像を生成するようになっている。 そのため、ネット上の偽情報を見分けるのが難しくなり、多くのデジタル・アーティストが、仕事を見つけるのが難しくなったと不満を漏らしている。

2022年に『ミッドジャーニー』が初めて公開されたとき、私たちは皆、"ああ、かわいいね "と笑っていました」と、ミシガン州の映画コンセプト・アーティスト、リード・サウセンは言う。 「今、人々はミッドジャーニーのために仕事を失っている。」

この記事が気に入ったらサポートをしてみませんか?