Geminiに色々と描いてもらって‘プロンプトエンジニアリング’についても考えてみる。
Gemini画伯の作品群
A nostalgic image of a small tabby cat lying on a brown sofa
A fluffy white cat grinning on a sofa
A grin without a cat
2枚目のように「ニヤニヤしたネコ」の画像は比較的にスムーズに生成してもらえるものの、ネコ成分を保ちつつ姿だけを消すというプロンプトの調整は多少の工夫を要するものでした。改めて、John Tennielの挿絵の魅力を感じるところでもあります。
‘プロンプト・エンジニアリング’をカタカナで語る空虚さ
ところで、Geminiの画像生成機能に関しては、この記事の執筆時点では日本語のサポート対象外であるようです。
より正確に言えば、「日本語での画像生成はサポートしていますか?」と尋ねると、以下のようにやる気に満ちた回答が返ってくるのですが:
その後、こうなります:
実情として、生成系AIが英語圏を中心に進化・発展を遂げていく可能性が高い中では、日本語がサポートされるまでのタイムラグは「出遅れ」の原因となりうる。
‘プロンプト・エンジニアリング’などと言ったところで、それをカタカナで(i.e. 日本語という枷を嵌められた範囲で)語っている限りは、周回遅れで走っているだけに過ぎないのかもしれない。
もちろん、その設計したプロンプトを英訳するところからAIに頼んでしまえば良いとする向きもあるでしょう。しかし、回答の正確性や偏りのダブルチェックができるだけの力や、そもそも自分がどのような指示を投げているのか正確に把握できる力を持たずしてAIツールを用いることには、決して少なくないリスクを伴うものです。
この記事はこの記事で、ガリレオの専門的・職業的な立場が影響している、一種のポジション・トークであるかもしれない。
しかし、今後ますますAIや自動翻訳が日進月歩で進んでいけば、英語/語学学習の必要性が無くなっていくのではないか?という楽観論(?)に対しては、単に「当たり前のように英語に code-switchingしてAIと対話できる人の方が、便利な機能を一足先に・より幅広く活用することができる世界」が訪れるだけなのではないかと考えています。
つまり結局、従来の「英語/語学ができた方が便利」という話は、その形や中身を少しずつ変えて存在し続けるものと思う。もちろん、その学びの過程でAIが活用できるなどという面でも変化は常に生じていくものでしょうが。
結論めいたこと
人間の脳が新たなことを学び創造性を拡張していけるからこそ、生成系AIで何がどこまでできるか実験しながら可能性を探っていく面白さがあるものだとガリレオは考えている。
いわゆる「作業」として機械の方が迅速・正確・安全にできることは、AIやロボットに任せてしまうのもアリでしょう。私にとっては、頭の中にあるイメージを絵に描く段階は「作業」として画像生成してもらう方が明らかに良いことは自覚があります。
他方で、絵描きにとっては、描く工程そのものも創造性の発現となる部分であるはずで、AIも絵を描けるようになったからといって、人間の描く絵の価値は存在し続けるものです。
たとえば AIに Vincent van Goghの画風や技法を模した画像を生成してもらうことは、 もう既に秒でやってもらえるレベルのことでしょう。
しかし、Londonの The National Galleryで「ひまわり」を初めて目にした時のような、心に何か強烈な—言語学者が言語化できないほどの—インパクトを残し、留学帰国前のパリ旅行の際には Musée d'Orsayにも作品を見に行こうとまで思わせた、その「何か」は、AIがどれだけ進歩しようとも、Gogh本人にしか表現できないのだと思います。
この記事が気に入ったらサポートをしてみませんか?