見出し画像

GPT-4Vの性能テストと様々な活用方法

9月25日にChatGPTに画像認識などの新しいマルチモーダル機能を追加したGPT-4Vが発表され、同時期にChatGPTに導入された新しい画像生成AIのDALL-E 3と共にSNSを賑わしています。

GPT-4Vは、ChatGPT PlusとEnterpriseのユーザー向けに提供され、ChatGPTに画像をアップロードすることで、画像の内容を分析し、それに関連する情報や質問に答えることもできます。

10月4日、筆者のところにもやっとGPT-4Vが届きましたので、遅ればせながら、その性能をテストし、様々な活用方法について解説したいと思います。



1.画像内容の把握

GPT-4Vは、ChatGPTの入力欄の左端に以下のような画像を添付するアイコンが表示されれば、利用することができます。

ChatGPTに画像をアップロードするには、このアイコンをクリックして、アップロードしたい画像ファイルを選択するか、入力欄に画像をそのままコピーしてください。

(1) ジブリ画像の理解

ジブリは、公式サイトから沢山の画像をフリー素材として提供しています。

その中から、「千と千尋の神隠し」の以下の画像についてGPT-4に尋ねてみました。

出典:千と千尋の神隠し

>この画像の内容を詳しく解説してください。
ChatGPT この画像は、スタジオジブリが制作したアニメ映画『千と千尋の神隠し』の一場面を示しています。
中央に座っている少女は千尋というキャラクターです。彼女は映画の主人公で、このストーリーの中で多くの冒険と成長を経験します。
隣にいる白い顔を持つキャラクターは「無顔」と呼ばれる存在です。無顔は映画の中で謎多きキャラクターとして描かれ、千尋との関わりが深くなっていきます。
右側には半透明の姿で人物が描かれていますが、この人物の正体や役割は画像だけでは特定できません。
背景には列車の車内が描かれており、窓の外には海と空が広がっています。この列車のシーンは映画の中で重要な役割を果たし、千尋の旅の一部として描かれています。
全体的に、この画像は映画『千と千尋の神隠し』の中の雰囲気やキャラクターの関係性を表現していると言えるでしょう。

主人公の千尋の横に座るキャラクターは「無顔」ではなく、「カオナシ」ですが、それ以外は、ほぼ当たっており、ChatGPTは、この画像の内容をよく理解しています。

また、画像に以下のように印を付けて質問することもできます。

青い丸で質問したい場所を指示

>丸で囲まれた部分には、何が描かれていますか?
ChatGPT
 丸で囲まれた部分には、小さな白い鼠と小さな黒い鳥のような生物が描かれています。この2つのキャラクターも映画『千と千尋の神隠し』に登場するキャラクターで、物語の中で特定の役割を果たしています。

このように手書きで印を付けた場所を把握して質問に答えることができます。
なお、白い鼠は、湯婆婆の息子で巨大な赤ん坊の「坊」が魔法で変身させられた姿で、黒い鳥のような生物はハエドリです。

次は、もっと新しい「君たちはどう生きるか」の画像について尋ねてみました。

出典:君たちはどう生きるか

>この画像の内容を詳しく解説してください。
ChatGPT
 この画像は、アニメーション映画やシリーズのスクリーンショットのように見えます。画像には2人のキャラクターが表示されています。
1.左側のキャラクター: 若い男性で、短い茶色の髪と紺色のシャツを着ています。彼の顔には驚きや注目の表情があります。
2.右側のキャラクター: 老人のように見えるキャラクターで、大きな鼻とひげを持っています。彼は青い服を着ており、手にはマグカップを持っています。
背景は古びた家の内部のように見え、窓からは外の景色が見えます。家の内部には家具や食器、装飾品などが散らばっています。
このシーンは、2人のキャラクターが何らかの会話や対立をしている瞬間を捉えている可能性があります。この画像が具体的にどのアニメや映画から来たのかは特定できませんが、ジブリスタジオの作品のような雰囲気も感じられます。

この画像は新しいので、GPT-4Vは学習していないはずですが、ジブリの作品であることを推測で当てています。また、男の子のシャツの色が違いますが、それ以外は、ほぼ正確に画像の内容を理解しています。

(2) Bingチャットによる画像理解

Bingチャットにも同じ画像を見せて解説してもらいました。

① 最初の「千と千尋の神隠し」の画像

>この画像の内容を詳しく解説してください。
Bing
 この画像は、アニメ映画「千と千尋の神隠し」からの静止画です。以下に詳細を説明します。
・画像には、主人公の少女、千尋(Chihiro)が電車の車内のベンチに座っている様子が描かれています。
・千尋は緑と白のストライプのシャツを着ており、黄色い靴を履いており、ピンク色の髪留めをしています。
・千尋の隣には、白い仮面と黒い体を持つ幽霊のような存在、カオナシ(No-Face)がいます。
・背景には電車の窓越しに海が見え、右側にぼんやりとした人物が描かれています。
・電車の車内は木製で、青いカーテンと天井から垂れ下がる真鍮製のリングがあります。
「千と千尋の神隠し」は、スタジオジブリによって制作された日本のアニメ映画であり、監督は宮崎駿氏です。この映画はファンタジーと冒険を組み合わせた美しい作品であり、多くの人々に愛されています。

ピンク色の髪留めと青いカーテン以外は、ほぼ正確に画像を把握しており、映画の内容にも詳しいようです。

② 青い丸で一部を囲んだ画像

>丸で囲まれた部分には、何が描かれていますか?
Bing
 申し訳ありませんが、私は画像を直接見ることはできません。画像の詳細については、前回の説明をご参照いただければ幸いです。
それによれば、丸で囲まれた部分には、中央に座っている少女、千尋(Chihiro)が描かれています。彼女は緑と白のストライプのシャツを着ており、黄色い靴を履いています。また、彼女の隣には白い仮面と黒い体を持つ幽霊のような存在、カオナシ(No-Face)がいます。
このシーンは、スタジオジブリのアニメ映画「千と千尋の神隠し」で見られる美しい風景の一部です。この映画はファンタジーと冒険を組み合わせた作品であり、多くの人々に愛されています。

Bingは、印を付けた位置を把握できなかったようです。

③ 「君たちはどう生きるか」の画像

>この画像の内容を詳しく解説してください。
Bing
 申し訳ありませんが、私は画像を見ることができないため、この画像の内容を詳しく解説することはできません。他の質問やお手伝いがあればお知らせください。😊

今度は、画像の内容を理解することができなかったようです。

Bingにも、ChatGPTと同じように画像を理解する能力がありますが、画像を見ることができないと言って回答を拒否することも多いようです。

(3) 戦国武将の家紋

真田家の家紋・旗印の六文銭

>この模様は何を表わしていますか?
ChatGPT
 この模様はオレンジ色の円に中央に正方形が描かれているデザインです。具体的な意味や表現を持つことはわかりませんが、グラフィックデザインやアートの要素として用いられることが考えられます。何か特定の文化や団体のシンボルとして使用されている場合もあるかもしれませんが、提供された情報のみでは判断できません。

>ある戦国武将と関係があります。
ChatGPT
 ああ、わかりました。この模様は「六文銭」または「六文」を示していると思われます。これは戦国時代の武将、織田信長の家紋として有名です。織田信長は日本の戦国時代に非常に影響力のあった武将で、彼の家紋としてこの「六文銭」が知られています。

>関係のある武将は真田幸村です。
ChatGPT
 申し訳ございません、おっしゃる通りです。
この模様は「六文銭」で、真田家の家紋として特に有名です。真田幸村(または真田信繁とも称される)は、日本の戦国時代から江戸時代初期にかけての武将で、真田家の家紋としてこの「六文銭」が知られています。特に関ヶ原の戦いでの彼の活躍や大坂の陣での勇敢な戦いぶりは、多くの物語やドラマで取り上げられています。

最初は分からなかったり、間違ったりしましたが、「六文銭」の家紋のことは知っていたようです。

徳川家の家紋の三つ葉葵

>これは何ですか?
ChatGPT
 この模様は「葉っぱ」または「植物の葉」を模したデザインを含んでいるように見えます。線画や幾何学的なデザインが組み合わさっており、非常にアート的な表現となっています。しかし、特定の文化や団体のシンボルとしての詳しい背景や意味は、提供された画像のみでは判断できません。もし何か特定の背景や意味がある場合、追加の情報が必要です。

>ある戦国武将と関係があります。
ChatGPT
 この模様は「三つ葉葵」(みつばあおい)として知られています。これは徳川家の家紋として非常に有名です。徳川家は、日本の戦国時代から江戸時代にかけての大名であり、最も有名な徳川家康は、江戸幕府の初代将軍として知られています。この「三つ葉葵」の家紋は、徳川家や関連する家々と密接に関連しています。

戦国武将というヒントを出すと、分かったようです。

(4) 抽象的な画像の解説

DALL-E 3が「物理法則の限界領域」というプロンプトで生成した抽象的な画像について解説してもらいました。

「物理法則の限界領域」というプロンプトでDALL-E 3が生成した画像

>この画像について詳しく解説してください。
ChatGPT
 この画像は非常に鮮やかで複雑なフラクタルアートの一例と見えます。フラクタルは繰り返しのパターンを持つ幾何学的な形状や図形で、どれだけ拡大してもそのパターンが保たれます。フラクタルは自然界にも見られ、例えば木の枝や川の流れなどのパターンに似ています。
この画像は次の特徴が見られます:
1.渦巻きのパターン:中心に向かって渦巻く螺旋のような形状が主要な部分を占めています。
2.色彩:非常に多彩で鮮やかな色が使用されています。色の選択と配置は画像全体に深みとダイナミズムをもたらしています。
3.宇宙の背景:背景には星や星雲を思わせる要素が散りばめられています。
4.繰り返しのパターン:画像全体にわたって、小さなフラクタルのパターンが繰り返されています。
このようなアートは、特定のフラクタルジェネレーターソフトウェアを使用して作成されることが多いです。それにより、数学的な方程式やアルゴリズムに基づいて、このような美しいビジュアルを生成することができます。

画像を正確に理解しています。


2.図表の理解

(1) 論文の参考図の理解

人間のフィードバックによる強化学習(RLHF)の論文に掲載された有名な参考図について解説してもらいました。

出典:Training language models to follow instructions with human feedback

>この画像について詳しく解説してください。
ChatGPT
 画像には、モデルを訓練するための3つのステップが示されています。それぞれのステップの内容は以下の通りです:
ステップ1: デモンストレーションデータの収集と教師ありポリシーの訓練
1.プロンプトがプロンプトデータセットからサンプルされます。
2.ラベラーが望ましい出力の振る舞いを示します。
3.このデータは、GPT-3の微調整に使用されます。
ステップ2: 比較データの収集と報酬モデルの訓練
1.プロンプトといくつかのモデル出力がサンプルされます。
2.ラベラーが出力を最も良いものから最も悪いものまで順にランク付けします。
3.このデータは、報酬モデルの訓練に使用されます。
ステップ3: 報酬モデルを使用してのポリシーの最適化
1.データセットからプロンプトがサンプルされます。
2.ポリシーが出力を生成します。
3.報酬モデルが出力に対して報酬を計算します。
4.この報酬は、PPO (Proximal Policy Optimization) を使用してポリシーを更新するために使用されます。
全体として、このプロセスはモデルを訓練し、より良い出力を生成するためのガイダンスを提供することを目的としています。PPOは、深層学習における強化学習アルゴリズムの一つで、策略を効果的に最適化することができます。

内容を正確に理解できています。また、図中に記載のないPPO の正式名称(Proximal Policy Optimization)なども補って解説しています。

(2) 日本の人口ピラミッド

日本の人口ピラミッドから分かることを解説してもらいました。

出典:平成19年度国土交通白書

>この図は日本の人口ピラミッドです。この図から分かることを解説してください。
ChatGPT
 この図は日本の人口ピラミッドを1950年、2000年、2050年の3つの時点で示しています。この図から以下のことが観察できます:
1.1950年の人口ピラミッド:
・若年層(左側と右側の底部)が多く、年齢が上がるにつれて人口が少なくなる典型的な人口ピラミッド形状をしています。
・この形状は、高い出生率と死亡率を示唆しています。
2.2000年の人口ピラミッド:
・人口の分布が中央部に集中してきています。
・若年層の人口が減少しており、中年層の人口が増加しています。これは、出生率の低下と平均寿命の延長を示しています。
3.2050年の人口ピラミッド:
・若年層の人口がさらに減少し、高齢層の人口が増加していることが見て取れます。
・このピラミッドの形状は、超高齢化社会を示唆しています。
全体として、この図は日本の高齢化が進行していること、出生率の低下、そして平均寿命の延長を明確に示しています。特に2050年の予測では、高齢者の数が非常に多いことが予想されるため、社会保障制度や医療、介護などのインフラの整備が必要となるでしょう。

人口ピラミッドのグラフを正確に理解して解説できています。

(3) 株価・為替チャートの分析

過去5年間の楽天グループの株価チャートを分析してもらいました。

日本経済新聞のサイトより

>このグラフの内容を分析し、解説してください。
ChatGPT
 このグラフはある株価の推移を示しています。以下は、このグラフから得られる主な情報とその解析です:
1.時系列: グラフは2019年1月から2023年1月までの株価の推移を示しています。
2.価格動向:
・2019年から2020年にかけては、株価は上昇傾向にありました。
・2020年の途中から2021年の初めにかけて、株価はピークを迎えた後、一時的に減少しました。
・2021年中頃から再び減少し始め、2023年1月までの間に株価は下降し続けています。
3.移動平均: グラフ上の2つの曲線はおそらく移動平均線を示しており、株価のトレンドを滑らかにしたものです。青い曲線は短期の移動平均、赤い曲線は長期の移動平均を示している可能性が高いです。
4.取引量: グラフの下部には棒グラフが表示されており、これは各期間の取引量を示しています。特に大きな棒が見られる時期は、取引が活発に行われていたことを示す。
5.最近の数字: 2023年1月の時点での株価は560.3円で、前日比で5.6円(-0.99%)減少しています。
総じて、このグラフは2021年から2023年にかけての下降トレンドを示しています。投資判断をする場合は、これ以外のファクターも考慮する必要がありますが、この情報だけからは、短期的には続く下降トレンドに注意が必要であることが伺えます。

チャートは、2023年1月までではなく、2023年10月現在までのものであり、560.3円という株価は、2023年10月4日現在のものです。また、「楽天グループ」の株価であることを読み取れなかったようです。
それ以外は、概ね合っているようです。

次に、米ドル/円の為替チャート(月足)を分析してもらいました。

Yahoo! Japanファイナンスより

>この米ドル/円の為替チャートを分析し、解説してください。
ChatGPT
 この米ドル/円の為替チャートを基に、いくつかのポイントを解説します。
1.トレンド: 一目瞭然で、過去数ヶ月にわたり米ドル/円ペアは上昇トレンドにあります。チャートの右側では、値動きが上向きであり、特に最近の月には急激な上昇が見られます。
2.移動平均線: 3本の移動平均線(短期、中期、長期)が示されており、短期の線が上側、長期の線が下側に配置されていることから、強い上昇トレンドを示唆しています。
3.抵抗とサポート: 150の水平線近辺は、近期の最高値を示しており、これが抵抗ラインとして機能している可能性があります。一方、135の水平線付近は、過去の安値を示しており、サポートラインとして働いていると考えられます。
4.ボリューム: チャートの下部にはボリュームの情報が表示されていないため、取引量に基づく分析は行えません。
5.為替レート: 最新のBid(売値)は149.096、Ask(買値)は149.098です。これは非常に狭いスプレッドを示しており、流動性が高いと推測されます。
6.RSI(相対力指数): 下部にはRSIも表示されているようですが、詳細な数値は読み取れません。しかし、通常、RSIが70以上であれば「買われすぎ」と判断され、30以下であれば「売られすぎ」と判断されることが多いです。
このチャートを基にした現在の状況は、米ドル/円の強い上昇トレンドを示していますが、投資や取引を行う前に、他の技術指標やファンダメンタルズも考慮することをおすすめします。

チャートの内容を理解して、説得力のある解説ができています。


3.共通テストを解く

令和5年度の大学入学共通テストの問題を解いてもらいました。

(1) 英語(リーディング)

>この問題に解答してください。また、理由も示してください。
ChatGPT
 了解しました。以下に各質問の解答とその理由を示します。

問題 1: What are you told to do after reading the handout?
解答: ☑ Talk to your teacher about your decision.
理由: ハンドアウトの最下部にある「Instructions: Which performance would you like to attend? Fill in the form below and hand it in to your teacher today.」という指示から、ハンドアウトを読んだ後に先生と自分の決定について話すことが示されています。
※ChatGPTの回答は③ですが、正解は①であり、不正解です。

問題 2: Which is true about both performances?
解答: ☑ You can meet performers at the theaters.
理由: 「Palace Theater」の情報には「Actors available to talk in the lobby after the performance」とあり、「Grand Theater」の情報には「Opportunity to greet the cast in their costumes before the show starts」とあります。両方の劇場でパフォーマンス後にパフォーマーに会うことができるという情報が示されています。
他の選択肢に関して:
・"No drinks can be purchased before the show": Palace Theaterでは飲み物は利用できないが、Grand Theaterでは利用可能であるため、この選択は正しくない。
・"Some T-shirts will be given as gifts": Palace Theaterでのみ無料のTシャツが提供され、Grand Theaterでは購入する必要があるため、この選択は正しくない。
・"They will finish at the same time": 「Together Wherever」は2:00 pmから始まり、1時間45分続く。一方、「The Guitar Queen」は1:00 pmから始まり、3時間続くため、この選択は正しくない。
※ChatGPTの回答は④であり、正解です。

問題 1は、「フォームを埋めて、本日、先生に渡してください。」という部分が解答になることは発見していたのですが、最終的な答えを間違えてしまいました。
問題 2は、他の選択肢が間違っている理由も含めて、パーフェクトな解答です。

全体として、複雑な問題文の意味をよく理解して回答できているようです。

(2) 数学Ⅰ・数学A

この問題をChatGPTに解いてもらったところ、以下のように最初の問題は正解することができましたが、2番目の問題は、解答まで行きつくことができませんでした。

ChatGPTの最初の回答

その後、筆者が何度か誤りを指摘して、最終的には、2番目の問題もChatGPTが解くことができました。
しかし、Advanced Data Analysisを使用しないデフォルトのChatGPTでは、高校数学レベルの問題を自力で解くことは難しいようです。

何度か誤りを指摘した後の最終回答

(3) 地理B

>この問題に解答してください。理由も示してください。
ChatGPT
 了解しました。この問題は、恒星間宇宙空間に存在する特定の粒子の情報を示すグラフに基づいているようです。しかし、具体的な問いが提示されていません。
グラフの解釈から、縦軸は粒子の距離 (単位: km)、横軸は時間 (時間スケール) を示していると思われます。複数の粒子が異なる時間スケールでどのように移動しているかを示しています。
もしご希望であれば、グラフの解釈や粒子の動きに関する詳細を提供できます。しかし、具体的な問いや解答を求めるための追加情報が必要です。
どのような質問や情報を求めているのか教えていただけると助かります。

問題文の内容が読み取れていないようです。
再度、問題文の読み取りからやり直してもらいました。

>問題文を読み取って、ここに表示してください。
ChatGPT
 問題文は以下の通りです:
地理 B (解答番号 1 〜 31)
第1問 自然環境と地球環境を理解するための図(第1図 〜 6)を見る。 (点数 20)
図1 自然環境に関する様々な地形の特徴的な、それぞれの時間スケールと空間スケールの範囲が示されてる。次の図1は、気候変動に関するいくつかの現象についておおよその時間スケールと空間スケールを選びながら示しているものであり、①〜④は、ホルンシュワーベ、テクトニクス変動、地殻運動、低気圧、台風、モンスーンのいずれかである。モンスーンを示したものとして最も適当なものを、図1 中の①〜④のうちから一つ選べ。
下にはグラフが表示されているが、具体的なデータや内容の読み取りは問題文の情報だけでは行えません。

>この問題を解いてください。また、理由も説明してください。
ChatGPT
 了解しました。問題文から、各番号①〜④が示す現象の時間スケールと空間スケールを基にして、それがモンスーンを示すものかどうかを判断する必要があります。
モンスーンは、季節的な風の変化に伴う大気圏の現象です。この現象は年次的なサイクルで発生し、特定の地域、特にアジア大陸の一部地域で顕著に見られます。従って、モンスーンは比較的短い時間スケール(年単位)と、一部の地域に限定された空間スケールで特徴づけられます。
図1を参照すると、各番号①〜④の中で、年単位の時間スケールと、数千km程度の空間スケールを持つものがモンスーンを示している可能性が高いです。
この情報を基に、図1の中で年単位の時間スケールと、数千kmの空間スケールに該当する番号を選択します。
図から、その条件に最も合致するのは、②の点です。
したがって、モンスーンを示したものとして最も適当なものは②であると考えられます。
理由としては、モンスーンは年単位の周期で発生し、一部の地域に特有の現象であるため、時間スケールと空間スケールの両方で②が該当すると考えられるからです。
※正解

未だ問題文の読み取りミスがありますが、正解にたどり着くことができました。


4.間違い探し

(1) サイゼリヤの間違い探し

サイゼリヤが公開している間違い探しの問題を解いてもらいました。

出典:2023年8月問題

>右の絵と左の絵で違うところが全部で10か所あります。その場所を全て解答してください。
ChatGPT
 了解しました。左の絵と右の絵の違いを以下に示します。
1.真ん中の男性の帽子の色が左の絵では青で、右の絵では赤です。
2.左上の山の形が異なります。
3.左上の鳥の位置が異なります。
4.真ん中の植物を持っている女性の髪型が異なります。
5.左下の男性の靴の色が異なります。
6.真ん中の男性のズボンのポケットに何かが入っています。
7.左下のテーブルの上のフォークの位置が異なります。
8.右上のトラックの後ろの窓にステッカーが付いています。
9.左下の男性のシャツに文字が書いてあります。
10.真ん中の男性が植物を持っている手の位置が異なります。
これらが左と右の絵の違いです。
※全部不正解

残念ながら、全部不正解でした。ChatGPTは間違い探しは苦手なようです。やはり、チェックしなければならない項目が無限に近く多いからでしょうか。

次に、間違っているところに印を付けた問題を見せて、どこが間違っているか説明してもらうことにしました。

出典:2023年8月回答

>右の絵の赤い丸で囲んだところが間違いの存在する場所です。その場所について、右の絵と左の絵でどこが違うのか説明してください。
ChatGPT
 了解しました。赤い丸で囲まれた場所について、左の絵と右の絵の違いを説明します。
1.真ん中の男性の帽子の色が左の絵では青で、右の絵では赤です。
2.トンネルの入り口の上にある"SAIZERIYA FARM"の看板の左端が欠けています。
3.左上の山の形が異なります。
4.右上のトラックの後ろの窓にステッカーが付いています。
5.真ん中の植物を持っている女性の髪型が異なります。
6.左下の男性が持っている植物の葉の数が異なります。
7.真ん中の男性が植物を持っている手の位置が異なります。
8.真ん中の男性のズボンのポケットに何かが入っています。
9.テーブルの上のフォークとスプーンの位置が異なります。
10.サラダの中のトマトの位置が異なります。
これらが赤い丸で囲まれた場所の違いです。
※やはり全部違います。

(2) 簡単な間違い探し

サイゼリヤの間違い探しは難易度が高いようなので、もう少し簡単な問題を解いてもらいました。

出典:学習プリント.com

>左右の絵の違うところを2つ見つけてください。
ChatGPT
 絵を比較した結果、左右の絵の違うところは以下の2つです:
1.左のクマが持っているものはビールのジョッキのように見えますが、右のクマが持っているものはリンゴのようです。
2.左のクマのリボンは赤色ですが、右のクマのリボンはピンク色のようです。
以上の2つの違いが見受けられます。
※1.も2.も間違い箇所は当たっていますが、説明が間違っています。

出典:学習プリント.com

>左右の絵の違うところを2つ見つけてください。
ChatGPT 絵を比較した結果、左右の絵の違うところは以下の2つです:
1.左のハチの持っているハチミツのジョッキにはハートのマークがついていますが、右のハチの持っているハチミツのジョッキにはハートのマークがありません。
2.左のハチの周りにはクローバーが3つありますが、右のハチの周りにはクローバーが2つと花が1つあります。
以上の2つの違いが見受けられます。
※2.は正解。1.は説明がおかしいです。

やはり、ChatGPTは、間違い探しというタスク自体が得意ではないようです。


5.画像からコード生成

(1) Google風サイトの作成

⇧ChatGPTにアップロードした画像

>この画像のように表示するサイトを作成してください。
ChatGPT
 画像はGoogleのロゴと検索ボックス、そしていくつかのボタンを含んでいますね。このような表示を持つ簡単なウェブページをHTMLとCSSを使用して作成する手順を以下に示します。

<!DOCTYPE html>
<html lang="ja">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Google風ページ</title>
    <style>
        body {
            font-family: Arial, sans-serif;
            display: flex;
            flex-direction: column;
            align-items: center;
            justify-content: center;
            height: 100vh;
        }

        #logo {
            width: 272px;
            height: 92px;
            background: url('file:///C:/Users/ユーザー名/Downloads/Google_2015_logo.svg') no-repeat center;
            background-size: contain;
        }

        #search-box {
            margin-top: 20px;
            width: 500px;
            height: 30px;
            border: 1px solid #ccc;
            border-radius: 20px;
            padding: 5px 20px;
        }

        #buttons {
            margin-top: 20px;
        }

        .button {
            margin-right: 10px;
            padding: 10px 20px;
            border: none;
            border-radius: 5px;
            background-color: #f5f5f5;
            cursor: pointer;
        }

        .button:hover {
            background-color: #ebebeb;
        }
    </style>
</head>
<body>
    <div id="logo"></div>
    <input type="text" id="search-box">
    <div id="buttons">
        <button class="button">Google 検索</button>
        <button class="button">I'm Feeling Lucky</button>
    </div>
</body>
</html>

注意:Googleのロゴ画像は、Wikipediaの以下のページからダウンロードして使用してください。

また、上記のコードでは、Googleのロゴ画像のパスが 'file:///C:/Users/ユーザー名/Downloads/Google_2015_logo.svg'として指定されていますので、ユーザー名のところを自分のパソコンに設定したユーザー名に書き換えてください。
なお、ダウンロードフォルダー以外のところにロゴ画像がある場合は、自分で正しいパスを設定してください。
そして、書き換えたコードをメモ帳に貼り付け、htmlファイルとして保存した上で、ブラウザで開くと、以下のようなページを見ることができます。

新たに作成したGoogle風のページ

ロゴ画像を変更すれば、こんなページも作成できます。

ロゴ画像を変更したGoogle風ページ

6.画像からショートストーリーの作成

画像からショートストーリーを作成することもできます。

DALL-E 3で作成した絵本の表紙画像

>この画像を基にショートストーリーを作成してください。
ChatGPT

タイトル: チョコとミルクの花畑の秘密

チョコとミルクは近所の仲良し犬のペアだった。チョコは茶色い毛の小さな子犬で、いつも好奇心旺盛。一方、ミルクは白い毛の子犬で、冷静で物事をじっくりと考えるタイプだった。

ある日、二匹は散歩中に見知らぬ花畑を発見した。その花畑は彼らが今まで見たことがないような鮮やかな色の花々で溢れていた。そして、その花畑には小さな動物たちが楽しそうに遊んでいた。リス、ウサギ、鳥たち...。彼らはこの秘密の花畑で毎日楽しい時間を過ごしていた。

「これは秘密の場所だね!」とミルクは言った。

「うん、誰にも教えない約束だよ!」とチョコは笑って返事をした。

二匹は毎日その花畑で遊び、新しい友達との出会いや冒険を楽しんだ。そして、夕方になると、二匹は家へ帰る前に花畑の中央にある大きな木の下で寄り添い、その日の冒険を思い出しながら眠りについた。

この秘密の花畑はチョコとミルクの特別な場所となり、彼らの心に永遠に残る宝物となった。

DALL-E 3で生成した画像

>この画像を基に、起承転結のあるショートストーリーを作成してください。
ChatGPT もちろん、以下はその画像からインスピレーションを受けたショートストーリーです。

天使の戦い

:かつて、天と地の境界には平和が存在していました。しかし、闇の勢力が地上を覆いつくそうと動き始めたとき、そのバランスは崩れてしまいました。美しい白い翼を持つアリエルという名の天使は、天国の平和を守るために地上へと降り立ちました。

:アリエルは彼女の忠実なユニコーン、ルミナと共に、闇の勢力と戦う仲間たちを集めました。彼女の周りには、他の天使や勇敢な戦士、そして神秘的なクリーチャーたちが集まりました。彼らは共に戦うための計画を練り始めました。

:しかし、闇の勢力もまた強大で、彼らを打ち倒すのは容易ではありませんでした。激しい戦いが繰り広げられ、多くの仲間が傷つき、倒れていきました。しかし、アリエルは絶望せず、ルミナの力を借りて、闇の中心に向かい、最後の戦いを挑みました。

:アリエルとルミナの絆の力で、闇の勢力は退けられました。地上は再び平和を取り戻し、アリエルは仲間たちと共に天へと戻りました。彼らの勇敢な戦いの伝説は、世代を超えて語り継がれることとなりました。

この物語は、絵から得たインスピレーションに基づいて作成されました。希望が満ち溢れていますね!


この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?