見出し画像

ChatGPT-4oの能力検証

 普段は、ChatGPT-4oを使用して、筆者執筆のエッセイやコラムの感想を書いてもらっているが、ChatGPT-4発表当時にGPTsを弄り回して遊んでいたことがあった。

 今回は、現在世界最高峰の生成AIとして人気を博しているChatGPT-4oをダイレクトに使って、ポスター制作や似顔絵、3Dオブジェクト、ロゴデザインとコインなど、実験的に生成することに。

 ポスターなどは予め撮影しておいた写真を合成したり、そのポスターに筆者の書のデザインを施したりできそうで、まだまだ応用範囲は広がりそうだ。

 似顔絵は似てないので、プロンプトの書き方を工夫すべきなのか、もっと、正面を向いたサイズの大きな自分の写真を使用すべきだったのかの判断がつかないが、生成AIの機能は把握できた。

 面白かったのは、3Dオブジェの生成である。素材が大理石風のものや木彫など、素材やテクスチャーを詳細にプロンプトに書き込めば、もっとディテールがアップし、アーティスティックなものができはしないかと期待している。

 最後に、弊社D&L Research Inc.のロゴはあるけれども、ChatGPT-4oに作らせてみたら、簡単すぎるプロンプトだったのか、最初はアジアンテイストで生成された。

 余り気に入らなかったので、今度はコインにしてみると、それなりのコインが生成された。

 その他、音声録音したものの文字起こしや動画の要約(解説)なども簡単にでき、更には、表集計&チャートのエクセルデータ処理なども自動的に体裁を整えたり可能のようだ。

 生成AIは、人間のアイデア次第では、化け物になってしまうほど多機能であり、想像を絶するような画像生成も可能であり、これからも際限のない進化を遂げながら、我々人間社会に大きな影響を及ぼすものとして注視する必要がある。 

 何はともあれ、現時点において、マルチモーダルなChatGPT-4oは生成AI世界の頂点に君臨しており、今のところ、他の生成AIへの興味は次第に薄れてきているように思えてならない。

 勿論、各分野の専門生成AIのレベルは非常に高いけれども、筆者の実務に必要か否かを考えれば、このChatGPT-4oで十分役割を果たすことになる。

似てない似顔絵
3Dオブジェクト(天使)
3Dオブジェクト(仔象)
3Dオブジェクト(子鹿)
3Dオブジェクト(ヒグマ)
ロゴデザイン
ロゴデザイン
コイン生成

▼ChatGPT-4oによる感想

以下はエッセイ「ChatGPT-4oの能力検証」に対する感想です。

このエッセイでは、著者がChatGPT-4oの多岐にわたる能力を実験的に検証し、その成果や可能性について述べています。全体を通して、著者は生成AIの持つ力に感嘆しつつ、その応用範囲の広さと実用性に対する期待感を強調しています。

まず、エッセイ冒頭で著者が述べているように、ChatGPT-4oを使ったエッセイやコラムの感想執筆は日常的な用途ですが、さらに進んだ用途としてポスター制作や似顔絵、3Dオブジェクト、ロゴデザインなどにも挑戦したことは、生成AIの多様な応用可能性を示しています。特に、ポスター制作では写真を合成することで、オリジナルなデザインが可能となり、その創造性を引き出す手段としてのAIの利用がうかがえます。

似顔絵の生成については、結果が思ったほど似ていなかった点に関する考察が興味深いです。プロンプトの工夫や写真の質の改善が必要であるとの認識は、生成AIを効果的に活用するためには、ユーザーの側でも試行錯誤が求められることを示唆しています。これは、生成AIの精度を向上させるためには、ユーザーの入力データや指示が重要であることを物語っています。

3Dオブジェの生成に関する記述も非常に興味深いです。素材やテクスチャーを詳細に指定することで、よりアーティスティックでディテールに富んだオブジェが生成可能であることに気づいた点は、生成AIの柔軟性と可能性をよく表しています。このような試みは、今後のデザインやアート分野における生成AIの利用方法を模索する上で有益な示唆を提供しています。

また、ロゴデザインやコインの生成に関する試行も興味深いです。簡単なプロンプトで生成されたロゴが気に入らなかったため、コインに挑戦した結果、それなりの成果を得られた点は、生成AIの柔軟な応用と試行錯誤の重要性を示しています。このような経験を通じて、生成AIが提供する無限の可能性に対する期待感が伝わってきます。

最後に、音声の文字起こしや動画の要約、エクセルデータの処理など、生成AIがビジネスや日常のさまざまなシーンで役立つ機能を持っていることが述べられています。これらの機能は、効率的な作業やデータ管理に大きく貢献することが期待されます。

総じて、このエッセイはChatGPT-4oの多機能性とその応用範囲の広さ、さらには生成AIの進化がもたらす可能性について深く考察しています。著者の実体験を通じて、生成AIが今後ますます人間社会に影響を与え、その利用方法が多様化していく様子が具体的に描かれています。このエッセイは、生成AIの現在の能力と将来の可能性に関心を持つ読者にとって、非常に有益で興味深い内容となっています。


▼ChatGPT-4oが、筆者のエッセイ「煮え切らない人」を読み生成したもの

「煮え切らない人」をポスター化

▼追記

ChatGPTの「GPT」は「Conversational Pre-training Transformer」の略です。それぞれの単語の意味は以下の通りです。

  1. Conversational(会話の):ChatGPTは会話形式で人間とインタラクションを行うため、この部分は「会話の」を意味します。

  2. Pre-training(事前訓練):モデルは大量のテキストデータを使って事前に訓練されています。これにより、幅広いトピックについて知識を持ち、様々な質問に対応できるようになっています。

  3. Transformer(トランスフォーマー):ChatGPTはトランスフォーマーアーキテクチャに基づいています。このアーキテクチャは、自然言語処理において非常に効果的であり、大規模なデータセット上での学習に適しています。

したがって、ChatGPTの「CPT」は「会話のための事前訓練済みトランスフォーマー」を意味します。


サポート、心より感謝申し上げます。これからも精進しますので、ご支援、ご協力のほどよろしくお願いいたします。