見出し画像

AIでプレゼン資料が完全自動化される日[考察系記事] 完全自動化される日は果たしてやってくるのか?

この記事は以下のようなかたにおすすめです。
・プレゼン資料作成の方法論に興味がある。
・AIで本当に自動化できるかどうかに興味がある。
・AIによる仕事の自動化自体に興味がある。


0. はじめに

0.1 いつ頃完全自動化が達成される?

シンギュラリティ:技術的特異点

AIによる知能, 生産が爆発的に増加する, いわゆるシンギュラリティ (技術的特異点) の到来がしばしば言われてます。先日, このような生産性増加を表すグラフ (近似式) が話題になりました。

横軸:西暦 縦軸:GNP国民総生産

横軸 (x) に西暦 , 縦軸 (y) にGNP国民総生産として, y=a/(2040-x) 
西暦が2040年近づくGNP無限になる説明です。
という事は『スライド作成くらい簡単自動化されますよね』とChatGPTに投げかけました。

あなた (ChatGPT) の考えでは何年ごろにスライド作成が完全自動化されると思いますか??
2030年には完全自動化される?

私自身もそう遠くない未来には完全自動まではいかないまでも, 高品質な下書きが自動作成されると思います。本記事ではどのようにしてそれが実現されるかの予測を主にChatGPTと一緒に考察していきたいと思います。

0.2 現時点でのAIスライド作成の自動化達成率

2024年3月の時点でAIによるプレゼン資料作成自動化達成率を100%の尺度でザックリと評価してください。
(パーセントはそのまま時間効率と考えることが出来ます。10時間の仕事→1時間に短縮なら90%)

以前紹介しました記事は現時点で有能自動プレゼン資料作成AI比較検証です。これらのツールを用いることでキーワード, 原案から簡単アウトライン, デザイン, 画像の提案などをAIが行ってくれます。

勉強会やマニュアル, 簡単なアイデアの説明のプレゼンにはたまに絶大な威力を出します。しかし高度考察が要求される資料作成には不向きで時間効率の観点からも達成率はまだまだの印象を受けます。

1. プレゼンテーションの現在, 過去, 未来

産業革命, 機械化の導入で人類仕事は大きく変わりました。今後AIの発展でさらに大きな変革期が訪れると思われます。本記事では人類の『仕事』を以下の3つに分類してみました。

① ワーカー(worker, 過去): 手作業や肉体労働が中心で, 直接的な生産活動に関与。
 オペレーター(operator, 現在): 機械やコンピューターの操作を通じて, より効率的な生産を実現。
 ウォッチャー(watcher, 未来): AIや自動化技術が主導する生産活動を監視・管理し, 高度な判断を下す。

人間の仕事の役割

次はプレゼン資料作成における人類の役割を3つに分類してみます。

プレゼン資料作成の現在, 過去, 未来
1. ワーカー(worker, 過去): スライド作成は手書きで, OHPシートを使いプレゼン。準備に時間がかかり, 手作業で修正が必要だった。

2. オペレーター(operator, 現在): スライドはPowerPointなどでデジタル化。テンプレート使用や多様な機能で効率的に資料作成。作業効率向上し, 魅力的なプレゼンが可能に。

3. ウォッチャー(watcher, 未来): スライド作成はAIによる自動化で, 指示出しのみ。AI作成のスライドを人間が確認・微調整。効率性が大幅向上し, クリエイティブな作業に集中可能。

私が小学生の時には先生がプロジェクターで手書き資料を映し出してたような記憶があります。大学生になりPowePointに初めて触れ, いずれ自動化されることを考えると感慨深いものです。

以下のnoteでプレゼン歴史が先史時代から紹介されています。

2. プレゼンスライドの分類

2.1 難易度別分類

一口にプレゼンといっても趣味雑学などの一般的な話からより先端の科学技術など専門的, 難解な考察を伴う, 高難易度なものまで範囲は広いです。ここではAIの視点から, 作成難易度でプレゼンを3タイプに分類しました。

DALLE3で以下の『低難易度』の文章プロンプト

1. 簡単(低難易度)
内容: 基本的なテンプレートを用いたプレゼン資料の自動生成, シンプルなテキストやリストの挿入, web上から得られる情報がメイン
: 一般的な知見の紹介 (健康, 歴史, 趣味, 雑学, 観光スポット, ビジネス, how to, 社会問題, 環境問題, 経済のtopic)

DALLE3で以下の『中難易度』の文章プロンプト

2. 中程度(中難易度)
内容: userが入力したデータが必要。解析と可視化を含むプレゼン資料の作成。高度な思考伴わない
: 新しいアイデア (レシピ, 生活の知恵) の紹介, 自己紹介, 簡単な計画書 (旅行日程, 学習計画, 社員学生のカリキュラム), 簡単な報告書, 業務マニュアル, 簡単な新規商品アイデア紹介

DALLE3で以下の『高難易度』の文章プロンプト
DALLE画像生成時のプロンプト:
A highly detailed, photorealistic digital painting of a PowerPoint presentation screen designed for a high difficulty level. This presentation slide is about a complex scientific research project, showcasing advanced data analysis on genetic sequencing. The slide features a title 'Genetic Sequencing: Unveiling the Blueprint of Life', and includes multiple sections: an abstract, methodology, results, and discussion. The results section displays complex graphs and charts illustrating genetic patterns, mutations, and potential implications for medical treatments. The discussion highlights the significance of these findings in understanding human genetics and potential future applications. Visual elements include detailed charts, DNA strands, and microscopic images of cells, with a sophisticated layout that effectively communicates the complex data and insights. The design is sleek and professional, with a color scheme that emphasizes clarity and precision.

3. 高度(高難易度)
内容: 複雑なデータセットの分析, 専門的な知識, 考察を必要とするテーマに基づいたコンテンツの生成
: 科学研究発表, 高度なビジネス戦略の提案, プロジェクト進捗状況
AIの役割: AIは高度なデータ分析技術を用いて複雑なデータセットから有意義なインサイトを抽出。専門的な知識を反映したコンテンツの生成

このカテゴリーの1と2に関しては現在のAIツールでなかなかの時間効率削減が可能です。(冒頭で同じような質問をしたときには20-30%と言っていた気がしますが, 眼をつむりましょう)

現在のAIでどれくらい自動化が達成できていますか? 時間効率的に。
100%:完全達成, 全自動
0%:手動

一方, 高難易度のスライドを作る場合, その分野の情報リサーチ, データ分析補助, 関連論文の英語文自動翻訳, 各種考察, アイデア創出の対話, 原稿, アウトラインの下書きなどAIを用いて補助的な自動化が可能であり, 時間効率として『30%位』の削減にとどまります。

2.2 各スライドの構成要素について

先ほどの難易度分類とも重複することが多々ありますが, スライドの構成要素, 特にテキストがどのようにつくられるか難易度別に以下の3パターン (ABC) に分類しました。

A. Web, 一般情報
B. ユーザー指示応答
C. 高度分析

まずA. Web, 一般情報はインターネットから得られる知識です。ChatGPTは主にインターネットから得られる情報を元にテキストを扱うためこのカテゴリは比較的容易に生成することができます。

A. Web, 一般情報:
インターネット上の公開データ, 事前学習データから概要を生成。
:基礎知識の説明。扱う範囲は膨大 (知識一般, news, 生活, 趣味, 文化, IT, 社会, 環境, 芸能)

B. ユーザー指示応答user (製作者) の考え, 個人情報などChatGPTが知らないことです。インターネットから得られず, userしか知らない情報です。このカテゴリは入力すればChatGPTはそのまま, または整理してテキストを生成しますが高度な考察を含まないものです。

B. ユーザー指示応答:
ユーザーが入力したデータをそのまま, または整理して作成するが高度な考察は伴わない。
: 学術 (実験, 研究データ), 一般 (自己紹介, 旅行日程, 生活の知恵, レシピ), ビジネス (業績, 進捗状況, 市場調査, 販売, 顧客データ, 業務マニュアル) 

下のスライドは本文はChatGPT, 挿絵はDALLE3で作ったAI純度100%の架空プレゼンスライドです。テーマとしては『低難易度』の歴史, 雑学, 一般的な内容の『超古代文明』としています。

このスライドを元にテキスト構成を分類していきます。『低難易度』ということでC考察含まない, A一般情報, Bユーザー指示応答大半を占めるように作成しています。

ABCを色分けしています。A:青 B:緑 C:ピンク

次は高度な考察, 専門的な知識 (C高度分析) が多く含まれる高難易度のプレゼンスライドです。

C. 高度分析はuserが入力した情報を元に複雑な分析, 高度考察によって生成されたテキスト, 図表などが含まれます。

C. 高度分析:
 ユーザーからの詳細な情報と専門知識を利用して, 複雑な分析, 高度考察に基づくテキストを生成。
: 研究成果の解析, ビジネス戦略の策定, 技術解説。

以下は今回の記事用に架空学会, 研究会の発表を想定し, 主にChatGPTにアイデアを与えて作ったものです。特に意識せずに作りましたが, 結果として構成要素は『C:高度分析』多く含む資料となりました。

そのため, 現実には存在しない病気, 治療法が含まれますので半分SFと考えて下さい。GPT4V (ision) にスライドを『実際に見て』解説してもらうために後半の考察partは英語を多めに含んでいます。

作成難度を上げるために敢えて, 図表グラフなど複雑なオブジェクトを多数含めています。実際学会発表では, 派手な画像, アニメーション控えるのが無難です。

個人的には効率化の観点からこのような過度に凝ったスライド作成に時間を浪費することは避けるべきで出来るだけ早い段階でAIに自動化されて欲しいと切に願います。

※また『画像生成AI』の使用に関しても, 定まった見解が無いので個人的には不使用をお勧めしています。→■鋭意制作中 学会スライド発表に画像生成AIを用いても良いのか?■

高難易度スライドはWebから作成できる部分はほんのわずか (下の例ではSlide2 緒言:Introductionのみ) です。タイトル, 患者情報などはこちらの入力した情報に簡単指示を加え作成することができますが…

考察Partは筆者アイデア, 他者研究者の論文内容を踏まえた高度考察が必要なため現在GPT4他のSlide作成toolでは全く歯が立ちません

3. どのようにして自動化するかの考察 (主にChatGPTが考察)

3.1 B (User 指示応答) が多く含まれるスライド

以下のスライドは患者カルテの乱雑な文章から病気の経過を医学用語を用いて整った文章にしたものです。現時点のGPTには『病歴要約』を作成する能力はなくuser側が作り方を『プロンプト』で指示するか, 予めGPTsに内蔵しておく必要があります。

プロンプト

方法としては

B user指示応答
現在:

1. ユーザーは患者カルテの情報を乱雑な形でChatGPT入力する。
2. ユーザーが事前に作成したプロンプトを用いてChatGPTが現病歴を生成する。
3. 生成されたテキストをPowerPointに手動でコピー&ペーストする。

非常に面倒くさく自動化から程遠いものです。

しかし近未来 (恐らく数年もかからない) のAIで簡単にクリアするものと考えています。

B user指示応答
未来
:
1. ユーザーは患者カルテの情報乱雑な形で次世代GPTに入力する。
2. 次世代GPTが事前学習した, またはGPTs (Plugins) に事前に組み込まれたプロンプトから現病歴を生成する。
3. 次世代GPTはPowerPointなどのプレゼンテーションソフトウェアへの直接出力をサポートしスライドの完全な自動作成を可能にする。

3.2 C (高度分析) が多く含まれるスライド

3.2.1 プレゼン内容全体のまとめスライド

意外と現在のChatGPTでも作成困難でした。鑑別診断 (この患者, といっても猫ですが で考えられる病気) はすんなり作成してくれましたが, プロブレムリスト (医学的に何が問題となっているか) は何回も作り直しを要求しました。

GPTが挙げたプロブレムリストは『家族歴, 喫煙, 飲酒歴』など一般的な医学的問題点でした。しかし, この患者 (新興ウイルス感染症) におけるプロブレムは上記がふさわしいと思います。これについての理由は以下の通りでした。

C高度分析 内容全体のまとめ
現在
1. ユーザーはプレゼンスライド全情報をChatGPTに入力する。
2. ユーザーが事前に作成したプロンプトを用いてChatGPTがプロブレムリスト鑑別疾患を生成する。
3. 生成されたテキストをPowerPointに手動でコピー&ペーストする。

しかし, 技術的にそれほど難しいものではなく, 近未来には全自動されるのではないでしょうか。

C高度分析 プロブレムリスト 鑑別疾患:
未来

B user指示応答と同じような方法で完全自動化される

3.2.2 論文を絡めた考察

以下のスライドはこの病気 (コロナパロディーに模した架空の感染症) の一般的な性質, 世の中に広く認知されていない時期の検査法などが無い時代の設定で他の論文を引用して考察する内容のテキストです。ここからは作成難易度が極端に跳ね上がります。

A一般知識, Bユーザー応答を多く含む前半のプレゼンパートでは自由度が低く, AIによる機械的な作業で完結します。一方, 後半のパートは『考察』がメインでプレゼン筆者が伝えたい内容は個人によって『無数』に存在するためAIは何も出来ないというか『何もしないという』表現が正しいのか自動では作成困難です。

テーマを与えずにただ『考察を作ってください』とお願いしたら, 非常に抽象的であたりさわりのない文章が生成されます。

これまでの情報 (患者背景, 検査結果, 治療経過) から症例報告用のプレゼンスライド考察パート
1枚目のテキスト本文を作成してください。 

これは『プール時計のパーツを投げ入れたときに, 偶然にも組み立てられた時計が出来上がる』に似ている気がします。

テーマを渡さずに考察系のスライドを作成する事の難しさについて

1. 現在のAI, テーマを渡さない:プールに時計のパーツを投げ入れたときに, 偶然にも組み立てられた時計が出来上がる確率。ほぼ0%
2. 現在のAI, 大まかなテーマを渡す:プールに投げ入れた時計のパーツが, たまたま壁にくっついて時計の形になる確率。非常に低い, たとえば0.001%。3. 現在のAI, 詳細なテーマやプロンプトを渡す:専門家が時計のパーツをうまく配置して, 水の流れで時計が組み立てられるようにする確率。比較的高く, 60-70%
4. 未来のAI, テーマを渡さない:高度な技術でプールに時計のパーツを投げ入れ, いくつかのパーツが自然に組み合わさって時計の一部ができる確率。低いが0ではない, 例えば5%
5. 未来のAI, テーマを渡す:先進的なロボットが時計のパーツをプールに投げ入れ, 的確な位置でパーツが組み立てられる確率。非常に高く, 90%以上。

未来のAIとプレゼン

重要なのはAIがどれだけ進化しても (さらに進化すればするほど出来ることも多くなるため), userがテーマを与えない限り生成される確率は極めて低くなるということです。逆にテーマ (プロンプト) をしっかり与えると現在のAIで十分に作成は可能です。

まあまあ詳細なプロンプト:
以下の例文は2020年当時のものです。最新の情報にup date してください。
文章のスタイルは例を踏襲して下さい。例えば箇条書きではなく文字列で。
学会スライド用のテキストで文字数も変えないでください。

例:Covid19患者の呼吸器検体から得た抗原1), PCR検査2)のいずれでも偽陽性, 偽陰性の報告が多く信頼性に課題がある。現時点で有用な検査や診断法が存在せず早期の確立が望まれる。 1) ■ 2) ■
■には引用文献が入る。

3.2.3 図表 折れ線グラフ, 散布図など

GPT4Vの理解完璧でした。

しかし, 見て理解する事と『作る』ことは全く別物で現在のAIではこのような複雑なグラフ, 図形を作ることは困難です。詳細な言語指示から, 『無理やり』作成することも可能ですが動作不安定なこと, 出力形式が『画像ファイル』であることが大きな欠点です。

折れ線以外の下記のスライドはいずれも『考察』を要求するだけでなく, 説明に用いるイラストなど自由度が高いため難易度は非常高いと考えます。

現時点ではtemplateをAIに渡し作成する方法もありますが, 再現性など技術的な課題は山積みです。

C 高度分析 グラフ:
現在
1. ユーザーは患者カルテの情報を乱雑な形でChatGPTに入力する。
2. ユーザーが事前に作成したプロンプトを用いてChatGPTがグラフを生成する。しかし, グラフは画像形式でありPowerPoint内で再編集することが出来ない
3. 生成された画像をPowerPointに手動でコピー&ペーストする。
4. 長方形などのオブジェクトはPowerPoint側で手動で作成。
※VBAで行うことも可能であるがトータルの時間効率もろもろを考えると非現実的
結論手動が早い

まとめとして, 現時点では手動が速く, 現実的に自動化が考えられるのはPowerPointのグラフ図表作成のAIアシスト化 (copilot) ではないでしょうか。

4. どの手法がいち早く完全自動化を達成するか

A photo-like image showcasing the future of full automation in presentation material creation, featuring advanced AI systems, digital interfaces, and innovative technologies seamlessly integrated into a professional setting.

最後にGPTにどの手法でプレゼンの完全自動化が達成されるのか未来を語ってもらいました。

どの方法がいち早く完全自動化を達成するのか?
1. 未来のGPT(自然言語処理モデルの進化)
: 40%
自然言語処理技術の急速進歩を考慮すると, このアプローチが比較的早期に実現可能性が高いと見られます。

2. GPT + 外部API(複合技術によるアプローチ): 30%
既存のデータソースやサービスとAIを組み合わせることで, 短中期的に有効な解決策を提供できる可能性がありますが, 複数の技術やシステムの統合には時間がかかる場合があります。

3. 専用ツールの高性能化(特化ツールGamma AIなどの進化): 20%
特定のニーズに合わせた専用ツールの開発は, 特化した機能を提供することができるものの, 広範な自動化を実現するための普遍的解決策を提供するまでには時間がかかる可能性があります。

4. 全く新しいアイデア(革新的な技術やアプローチ): 10%
革新的なアイデアや技術がプレゼン資料の完全自動化を実現する可能性は魅力的ですが, これらのアイデアが実現するまでには不確実性が高く, 時間がかかる可能性があります。












この記事が参加している募集

AIとやってみた