テクノロジーと人をつなぐ、AIのデザインパターン

2023年9月11日 13:34

Takramの野見山です。
さまざまなAIサービスが目まぐるしく進化する中、自分もものづくりという文脈でAIを利用する機会が徐々に増えてきました。この記事では、AIが自分のものづくりをどのように変えたかを切り口に、AIのデザインパターンについて考察していこうと思います。

テクノロジーと人をつなぐ

まず前提として、どれだけ優れたテクノロジーも人にとって扱いやすいものでなければ、その性能を十分に享受することはできません。AIの価値を十分発揮するには、人の持つ感情やニーズに寄り添ってデザインすることが大事です。
この記事では様々なAIサービスについて紹介しつつ、AIと人の関係性について書いていこうと思います。

1. 想像の一歩先を補完する、伴走型AI

まず最初に取り上げるのは、いま自分のものづくりワークフローの中で最も活躍しているAIサービス「GitHub Copilot」です。GitHub Copilotはエディタ上でAIがコーディングをサポートしてくれるサービスです。ChatGPTのように「指示して結果を待つ」必要がなく、書き進めているコードに基づいて「先回りして自動補完」してくれます。GitHub Copilotを利用していると「何で今書こうとしていることがわかった…！？」「あーそういう書き方もあるね」の連続です。

たとえば、テキストを整形して返す関数を作ってみましょう。文字数制限を定義する m_charLimit という変数と、Format という関数名まで書いたところ…

テキストの文字数を制限したい意図が伝わりました！👏
一般的な自動補完機能と同様、Tabキーを押せば提案は採用され、無視して書き進めれば提案は棄却されます。今回は採用してさらに書き進めます。

テキストの文字数を減らして改行したところ、AIが「はいはい、文字数を減らした分3点リーダーを加えたいんでしょ」と提案してくれました。……なんでわかった！？

このように予想外の何かを生成するというよりは、自分が作ろうとしているものの一歩先を補完してくれることが魅力だと思います。作っているコードの文脈をリアルタイムで理解してくれるので、自分の好む設計から大きく外れないのが使っていてとても心地よいです。
例えるなら、他のエンジニアにまるっとおまかせするというよりは、自分の分身やシニアエンジニアと一緒にペアプログラミングしている感覚に近いのかなと思いました。

たまに生成したコードの精度が悪いこともありましたが、コンパイラーやIntellisenseがコードの品質を別途チェックしてくれるので特に困ることはありませんでした。このように生成系と品質チェック系のシステムが同時に走ってくれると安心してものづくりに集中できます。

GitHub Copilotのような、こちらの意図や文脈に寄り添った提案をしてくれるAIは「伴走型AI」と言えそうです。もしAIにパーソナリティがあるとしたら「気の利く助手」でしょうか。この助手の優れた特徴は

こちらから指示を出す必要がないこと
リアルタイムに提案を更新してくれること
採用と棄却にほとんど労力がかからないこと

の3点だと思います。このような伴走型AIは、コーディングだけでなく自動補完が可能なデジタル上での様々なものづくりにどんどん組み込まれると予想されます。

本の執筆で、書き手のテーマ性やスタイルに応じて次に書くべきセクションやキーワードをリアルタイム提案してくれる
音楽制作で、今作っている展開に合わせて次のコードやリズムパターンを自動生成してくれる
UI/UXデザインで、レイアウトの続きや必要なコンポーネントを提案してくれる
マンガ制作で、ネームの続きや次のコマを生成してくれる
動画編集で、編集者の動画の流れに応じてトランジションをリアルタイムで提案してくれる

伴走型AIは人々の創造性や独自性を奪わず一歩先を先回りしてくれる存在になりそうです。

2. 二人三脚で作る、協業型AI

続いてよく利用するのはChatGPTです。特に文章作成・アイディエーション・開発に必要なデータの生成でいつも助けてもらっています。今回の記事でも以下のようにChatGPTにサポートしてもらいました。

最初の回答はこちらの意図とは異なる案ですが「あーそういうアイデアもあるね」と自分の想像の幅を広げてくれました。このようなアイデアの広さや網羅性もLLMの魅力の1つだと思います。

さらにものづくりに関連しそうな事例に絞ったところ良い案がいくつか出てきました！🙌
その後は新しい案をもとに原稿を修正して、文章のトーンや構成を変更したら完成です。このように順を追って振り返ると、アイディエーションをAIに依頼して終わりではなく、方向性をディレクションしながら協業する感覚に近いのかなと思いました。AIのおかげで自分は文章全体を通じて伝えたいことに集中できました。

このようなAIは「協業型AI」と言えそうです。もしAIにパーソナリティがあるとしたら「物腰の柔らかなクリエイター」でしょうか。このクリエイターの優れた特徴は

とにかく手と思考が早いこと
柔軟に対応してくれること
自分にはないアイデアやアウトプットを出せること

の3点だと思います。今後協力型AIは、画像・音声・動画などのマルチモーダルな入出力が可能になると予想されます。もし様々なAIとチームを組んで協業できれば、アイデアをラフに形にする初期プロトタイピングの段階から、映像・サウンド・グラフィックなど多方面からアプローチして、もっとクリエイティブに楽しくものづくりできそうです。ワクワクしますね！

コラム：画像生成系AIについて

画像生成系AIの進化は目覚ましく、自分もたまにMidjourneyを利用しています。構図の指定やスタイルの変換などできることが徐々に増えてきて品質も向上してきました。現在はサンプル写真の修正やテクスチャの生成など特定の用途で利用し始めています。このMidjourneyも二人三脚で画像を生成するという観点で協業型AIに分類できそうです。
ただ一方で、

モデルに合わせた伝え方の工夫が必要
モデルの癖が強く、こちらの意図は二の次になりがち
トライ＆エラーに時間がかかる

という理由から絶妙にかゆいところに手が届かない感じがしています。限られたユースケースでは活躍し始めていますが、協業するという観点ではあと一歩という印象です。「もっと柔らかいトーンで」「躍動感を感じるように」など対話を通じて柔軟に修正してくれるようになったら最高ですね。

3. 体系的な理解をサポートする、解説型AI

何か新しいものを作るとき、未知の領域について学ばなければいけないシーンがあります。そのようなとき自分が利用するのはChatGPTのAdvanced Data Analysis（旧Code Interpreter）です。
もともとAdvanced Data Analysisは、データの解析や図の生成などができるサービスですが、自分はどちらかというとPDFのレポート資料を渡して、新しい知識を説明してもらうのに利用しています。（正確にはPDFの解析は大概うまくいかないので、PDFをMarkdownに変換して渡しています）

たとえばメタバースについて知りたい場合を想定してみましょう。マッキンゼーの「メタバースにおける価値創造」というレポートを渡してChatGPTに解説をしてもらいました。（会話全文はこちら）

Web検索や読書と比べて良いところは、気になる点や議論したい点を自分のペースで聞けることだと思います。たとえば以下の会話では、NFTやブロックチェーンについて疑問に感じたことを尋ねました。抽象的で難しい内容も具体例まで説明してくれるのが魅力だと思います。

さらに関連しそうな情報を追加で渡して議論を深めます。以下の会話ではVision Proが今後メタバースにどのような影響を与える可能性があるのか尋ねました。それらしい回答が返ってきていることがわかります。（※ChatGPTの学習データがやや古い情報なのは念頭に置く必要があります）

他にも直接的にレポートの内容を知りたいだけなら、「これからアップロードする資料の内容について教えてください。各セクションについて順番に掘り下げてください。」というように聞けば、AIと輪読会を開くように会話を進められます。（実際の会話例はこちら）

このように新しい知識を説明してくれるAIは「解説型AI」と言えそうです。もしAIにパーソナリティがあるとしたら「物知りで思慮深い家庭教師」でしょうか。この家庭教師の優れた特徴は

幅広い知識をキュレーションして体系的に話してくれること
自分のペースで質問や具体例を聞けること
新しい観点を加えて議論を深められること

の3点だと思います。このような解説型AIは、今後もっとアクセスできる知識が増えていくと予想されます。たとえば最近話題のOpen Interpreter（ローカルで動かせるAdvanced Data Analysis）を使えば、インターネットからリアルタイム情報にアクセスして調べてもらうこともできます。

またNotionのようなドキュメンテーションツールで解説型AIが利用できるようになれば、チーム間でのナレッジ共有がもっと活性化するはずです。たとえば過去に作成された膨大なページを検索して、必要なナレッジを文脈に合わせて抽出できるようになれば、チームの生産性やクリエイティビティは格段に向上しそうですね。（※Notion AIではまだ実装されていません）

一方、解説型AIの進化に課題があるとすれば、知識が膨大になればなるほどトークン不足やレスポンスの遅延が発生することだと思います。心地よいUXを担保するためには、低コスト＆低遅延でのAI利用が必須です。

それを踏まえると、大規模なデータベース設計と同様、様々な知識の単位（ページ・章・段落）でインデックスを張ってAIの検索性を向上することが必要になります。今後はドキュメントの生成とインデックスの生成が一体化したツールが、最も広く普及するのではないかと予想されます。

まとめ

以上ものづくりという観点から、伴走型・協業型・解説型という3つのAIデザインパターンについて考察しました。
今後は3型のどれかだけでなく、様々なハイブリッド型が登場すると思います。たとえば伴走型AIとして紹介したGitHub Copilotも、チャットサービスをリリースしてコードの解説をAIにお願いできるようになりました。
ただその場合にも基本的に考える内容は変わりません。

人の感じる「便利さ」とは何か
人にとって「心地よい体験」とは何か
人はどのような「パーソナリティ」なら受け入れられるか

というように、人のニーズや感情に寄り添って考えることがとても大切です。今後も「テクノロジーと人をつなぐ」という観点から、AIの未来について考え続けていこうと思うので、ぜひフォローをよろしくお願いします。

この記事が気に入ったらサポートをしてみませんか？