Bing Image Creatorで画像を生成し、ChatGPT(GPT-4)で解釈する

ChatGPTの有料版にはこの10月から逐次DALL・E 3(AIによる画像生成)が搭載されるそうですが、私のアカウントにはまだ展開されていないで、一足先にDALL・E 3が搭載されたMicrosoft Bing Image Creatorで試してみました。
なお、以下の内容はX(Twitter)とFacebookに書いたものを一部加筆修正してまとめたものです。

まずはBing Image Creatorで作った画像とプロンプトを示します。キャプションに書いてある文言が、入力した時のプロンプト(指示文)です。

可愛らしい子犬たちが、本の上で遊んでいるシーンを写真風に
上海の夜景をモノクロの線画で。外滩を入れて。
中国風の紺色の服を着て、黒縁眼鏡をかけた知的な青年が、ランプが灯る書斎で一人で静かに本を読んでいる。
可愛らしい子猫たちが、本の上で遊んでいるシーンを写真風に
ドローンから見下ろした大阪城、モノクロの木版画
満月の静かな夜、川の上には一艘の手漕ぎの船、船の中には船を漕ぐ船頭の後ろ姿、浮世絵風
教室で、白髪で黒縁眼鏡をかけて年老いた男性の教師が、一人で静かに黒板の前に立っている、手には本を持っている、写真風
目を閉じて花の香りを嗅ぐお下げ髪の少女、モノクロの切り絵

Bing Image Creatorが生成した画像には見えない形で、Bingが生成したという情報が埋め込まれているそうです。
生成物の権利関係については、こちらをどうぞ。8番の文章を参照。
https://www.bing.com/new/termsofuse?FORM=GENTOS

私のChatGPTの有料アカウントには画像を解釈する機能はすでに展開されているので、ChatGPT(GPT-4)にBing Image Creatorが作った画像を解釈させてみました。

上にある白髪の男性の画像をChatGPT(GPT-4)に与えて、
这张图片里有什么?请用中文描述一下。
と指示してみると、以下のようにChatGPTは答えました。

教室で、白髪で黒縁眼鏡をかけて年老いた男性の教師が、一人で静かに黒板の前に立っている、手には本を持っている、写真風

这张图片中有一位中年或是老年的男士,他的头发和胡须都是白色的。他戴着眼镜,穿着白色的衬衫和灰色的毛衣。他手里拿着一本书,背景是一块黑板。这位男士看上去像是一名教师。

正確ですね。持続を表す動詞+着の練習に使えそうです。

上にある満月の画像をChatGPT(GPT-4)に与えて、
这张图片里有什么?请用中文描述一下。
と指示してみると、以下のようにChatGPTは答えました。

満月の静かな夜、川の上には一艘の手漕ぎの船、船の中には船を漕ぐ船頭の後ろ姿、浮世絵風

这张图片是一幅充满东方风情的画。画中有一个巨大的明亮的月亮高悬在天空中,月光照亮了下面的风景。在湖或河中,有一名穿着传统服装的船夫正在驾驶一只小船,船上还有两位乘客。湖或河的两侧是山脉和树木,还有一座小屋靠近水边。整体给人一种宁静、和谐的感觉,很有诗意。

画像に詩的な情緒があるとChatGPTが言うので、更に以下のように指示してみました。

根据这幅画,请你用古汉语写一首诗。

以下のようにChatGPTは一首作ってきました。

月映千山寂,水声唤旅思。
船中梦古今,风起故人迷。

こういうAIの生成した画像を使って”看图说话“(絵を見て話す)の練習はきっとおもしろいでしょう。
AIに画像を生成させるためのプロンプトを書くコツは描写文で書くことのようです。AIに思うような絵を描かせるためにどういうプロンプトを入れるのかというのは描写文の練習になるでしょう。
その前段階として、AIに画像を与えて解釈してもらい、このように描写するのかという事例を学ぶことができます。

オタクな中国語教員。日本語母語話者向けの中国語初級教材をPDFとEPUBで作っています。