見出し画像

自分が驚愕した生成AI事例紹介


note 4年ぶりの再開 AI/DXについて書きます


こんにちは、あおけんです。
4年ぶりの投稿になります。4年前は外資のカントリーマネージャーに転職した時にnoteを始め、108日間煩悩の日数だけ連続投稿をしてその後忙しくなってnoteを休止しました。
その後3年間カントリーマネージャーを務め、現在は独立してテラスという会社を設立して、DX関連の事業支援や営業支援を中心に事業を行っています。

今後その会社の事業のひとつの柱として育てたいと思っているのが教育・研修に関する事業で、今回からは、その法人向けに展開を検討している動画コンテンツの原稿をもとにnote向けの読み物コンテンツを随時投稿していきたいと思います。
今回の初回分は無料公開分として、次回以降は有料コンテンツとして提供していきたいと思っていますので、気になるトピックがあったらぜひ購入をお願いいたします。(note向けは1本ハーゲンダッツより安い価格設定にしようと思っています)

テーマはAIとDXについてです。
これまで作った原稿は50本以上でパワーポイントのスライドは400枚近くあるので、中には皆さんのお役に立つものもあるのではないかと思います。
この研修の全体感としては、単純なる技術の紹介というより今後進展するデジタル社会に向かって各企業が取り組まざるを得ないDX(デジタルトランスフォーメーション)の変革を行う上でどんな課題があるか、それをどう解決していけばいいか、といったところがメインテーマなっています。

それでは早速第一回目に入っていきます。

アリババのエモートポートレートアライブ

AI関連の記事は色々溢れかえっていると思いますが、今回は自分が色々見る中で感動したレベルの生成AI事例をご紹介したいと思います。
次回以降はもう少し硬い内容が中心となっていきますがまずは「生成AIすごいな」というところをお伝えできればと思っています。

最初に紹介するのは、Alibaba(アリババ)が開発した生成AI技術「Emote Portrait Alive(エモート ポートライト アライブ)」です。
これは、写真からリアルな動きや表情を生成するAI技術で、静止画像をまるで生きているかのように変換することができます。
 
Alibabaは、中国の杭州に本社を置く多国籍テクノロジー企業で、電子商取引、クラウドコンピューティング、デジタルメディアなど、多岐にわたる事業を展開していて、特にAI技術の研究開発においては、世界をリードする企業の一つです。
 
Emote Portrait Aliveは、ディープラーニング技術を活用して、静止画像からリアルな動きを生成します。
 
この技術は、写真の人物が自然な表情や動きをするビデオを自動で生成することができます。AIは、入力された画像の特徴を解析し、顔の筋肉や表情の動きをシミュレートします。また、声を合わせて合成することで、まるで本物の人物が話しているかのようなリアルな動画を作成できます。
 
Emote Portrait Aliveは、エンターテインメントや教育、マーケティングなど、様々な分野で活用されています。
例えば、歴史教育においては、歴史上の人物の写真を動かし、まるで本人が話しているようなプレゼンテーションを作成することができます。
 
それではここで動画をご覧ください。

いかがでしたか?
一枚の絵からこの動きを生成できるのは本当にすごいですね。
 
DXの観点から見ると、静止画、動画領域での生成AI技術の導入は、コンテンツ制作の効率化と新しい表現方法の創出に大きく貢献します。
 
企業は、この技術を活用することで、短時間で高品質なビジュアルコンテンツを作成し、顧客とのエンゲージメントを高めることができます。
 

 OpenAIのSora(ソラ)

次に紹介するのは、OpenAIが開発した動画の生成AI「Sora(ソラ)」です。
 
Soraは、テキストや画像からリアルな動画を生成するAI技術で、視覚的な表現力とリアリズムが非常に高いことで注目されています。
 
OpenAIは、サンフランシスコに本社を置くAI研究機関で、人工知能の安全な開発と普及を目指しています。設立者には、イーロンマスクやサムアルトマンなどの著名なテクノロジーリーダーが名を連ねており、AIの研究開発における世界的なリーダーとして知られています。OpenAIは、GPTシリーズなど、さまざまな革新的なAI技術を開発しています。
 
Soraは、ディープラーニングと生成モデルを組み合わせた技術で、入力されたテキストや画像をもとにリアルな動画を生成します。
この技術は、自然な動きや表情を再現する能力に優れており、まるで本物の人物が動いているかのような映像を作り出すことができます。
また、Soraはコンテキスト理解能力が高く、シーンの背景や環境もリアルに再現します。ユーザーは、簡単な指示を入力するだけで、高品質な動画を作成することができます。
 
AIが生成した60秒のデモ動画は多くの人に驚きを与えました。
その際に使われた作成指示はこのようなものでした。
東京の通りを、スタイリッシュな女性が歩いている。
暖かく輝くネオンや動く看板で満たされた街並み。
彼女は黒いレザージャケットに赤いロングドレス、黒いブーツを身に着け、黒いバッグを持っている。サングラスをかけ、赤い口紅をつけている。
彼女は自信を持ってカジュアルに歩いている。
通りは湿っていて反射し、カラフルな光が鏡のように映り込んでいる。
多くの歩行者が行き交っている。
 
それではここで実際に生成された動画をご覧ください。

いかがでしたか? 後半の女性のリアルな表情、描写はAIが作り出したものとは思えないですね。
 
DXの観点から見ると、生成AI技術の導入は、コンテンツ制作のプロセスを劇的に効率化し、創造性を大幅に向上させます。今後すべて生成AIで作成された映画やテレビシリーズというのも登場してくることになりそうです。

Googleのアストラプロジェクト

  2024年5月にGoogleも同様の画像認識、音声認識を使ってユーザと会話する機能をデモするアストラというプロジェクトのビデオを発表しています。
 
デモでは、まずカメラを使って「音が出るものが何かあったら教えて」とAIアシスタントに依頼をし、オフィス空間でカメラを回すとすぐに「スピーカーが見つかりました」との答えが返ってきます。
 
スピーカーに近づき、カメラ越しに矢印を書いて「スピーカーのこの上の部分は何て言う?」と尋ねると、すぐに「ツイーターと言って、高周波の音を出力します」とその役割も教えてくれます。
 
他にも、コーダーが書いているパソコン画面上のコードをカメラでスキャンし、「このコードは一体何を行うためのもの?」と訊くとかなり詳しく返答したり、カメラを外の風景に向けて「今どこにいる」と尋ねると「ロンドンのキングス・クロス周辺のように見えます」とアシスタントは答えています。
 
 「メガネをどこに置いたか覚えてる?」と尋ねられたAIアシスタントは、おそらく以前“見た”映像を記憶しているらしく、「メガネは机の上の赤いリンゴの近くにありました」と答えています。(1分30秒くらいまで)
 
早速実際の動画をご覧ください。

いかがでしたか?
 
視覚や記憶のサポート、即時情報の提供、そしてインタラクティブな会話を通じて、日常生活の様々な場面で役立つことが想像できますね。
 

GPT-4oによるリアルタイム翻訳機能

次に2024年5月に発表されたOpenAIの最新モデルであるGPT-4oによるリアルタイム翻訳機能を紹介しましょう。
 
ご紹介する動画では、リアルタイム翻訳機能をデモンストレーションしています。デモでは、イタリア語と英語の翻訳が、GPT-4oで自然な発音で行われる様子が紹介されています。
 
それでは実際の動画をご覧ください。

いかがでしたか? 非常にスムーズにリアルタイムな音声翻訳が実現されているのがわかりますね。

AIがバースデーをお祝いしてくれる!(GPT-4o)

それでは、最後に感情を持たないと思われているAIが感情溢れるやりとりを披露する動画で締めくくりましょう。
 
音声翻訳と同じタイミングで公開されたGPT-4oのデモで、OpenAIのスタッフ2人、ボーエンとジョーダンがケーキとキャンドルを準備している場面で、GPT-4oに今どんな状況だと思うかを尋ねます。
 
GPT-4oはその状況をスマートフォンのカメラで認識し、そこから誕生日を祝っていることを理解し、誕生日ですか、と回答します。
ボーエンは友人ジョーダンの誕生日だと答えます。
ジョーダンはGPT-4oにバースデーソングを歌ってくれるか、と聞き、GPT-4oはそれに快く応え、歌を歌います。
ジョーダンはそのことに感謝し、願い事をしていると、GPT-4oはジョーダンに願いが叶いますようにというお話です。
 
それでは実際の動画をご覧ください。

いかがでしたか?感情豊かなGPT-4oのコミュニケーション力はもはや人間と同等かそれ以上とも言えますね。 
 
今回は、2024年に入って劇的な進化を遂げている生成AIとは何かというのを頭で理解するのではなく、感じていだくことに重点を置いた構成となりましたが、どのような感想を持たれたでしょうか?
 
テクノロジーの進化に伴い、ビジネスそのものが大きく変わろうとしている今こそ、危機感を持ちながらも前向きにAI、そしてDXに取り組む好機です。
 
本研修を通して、デジタルトランスフォーメーションへの理解と実践力を身につけていただければと願っています。

以上で初回の講座は終了となります。

それでは、また次回の講座でお会いしましょう。ありがとうございました。


この記事が気に入ったらサポートをしてみませんか?