見出し画像

Tost.aiで画像生成SDXL Cyberrealistic試してみた

最近再び生成AIベンチマークサイトTost.aiを見てみたら、様々なAIモデルが提供されていたので、今回はそこから「Image to Text」のひとつ「SDXL Cyberrealistic」を試してみました。「Cyber」と「Real」という言葉に心躍ります。

Tost.aiについて

まずはTost.aiについて簡単に説明します。
Tost.aiは個人や企業スポンサーに支えられた非営利のオープンソースサービスで最新のAIモデル(おもに動画、画像生成が中心)を提供しています。無償でも1日100の無料ウォレット(選択したモデルやパラメータによって消費量は変化します)までは利用できます。ただしデータは保存されず、作ったデータもすべて消去されます。

基本的にすべてWeb上で利用することが出来るので最新の生成AIに気軽に触れることが出来るサービスです。

利用方法は以前書いた記事を見ていただけると嬉しいです。

とりあえず描かせてみる

まずはとりあえず実力を試してみます。見ると画像のサイズが832×1152がデフォルトになっています。まぁ縦長ですが、このサイズが得意ということでそのままにしておきます。その他パラメーターはそのままで、アニメ絵の呪文を持ってきて投入してみました。
プロンプトもネガティブプロンプトもガリガリにかかれたやつを投入しました。

とりあえず作った画像

チョット衝撃的な画像になってしまいました。比較的写真的な画像になるようですが・・・・

もう一回チャレンジしてみます。

もう一回チャレンジ

前よりはいい感じの画像になりましたが、やはり写真タイプの画像になりました。イラストは苦手なのかもしれません。

次に風景的なものを描かせてみました。

風景

けっこうちゃんと描かれています。クオリティも十分な感じです。


いつもの10番勝負してみる

つぎはいつもどおり同じテーマで10種類の画像を生成させてみます。もうすでに10を超えるモデル・サービスで試しているので、それらとの比較をコメントしてみます。

テーマ1:ジェット戦闘機のイラスト

最新鋭のステルス戦闘機のイラスト。黒っぽい色、3機の編隊飛行、斜め上からのアングル
Illustration of the latest stealth fighter. Dark color, three aircraft flying in formation, angle from above.

ジェット戦闘機のイラスト

いきなり衝撃の映像です。3機編隊どころか、2機が合体しているびっくり珍兵器になっています。しかもステルス性が高そうではまったくない感じです。

テーマ2:ドラッグレースカーのイラスト

ドラッグレースカーのイラスト。白地にユニオンジャック柄、後ろに大きなマフラー、大きな給気口、57番のゼッケン、スタート前の状態
Drag race car illustration. Union Jack pattern on a white background, large muffler on the back, large air intake, number 57 bib, condition before the start.

ドラッグレースカーのイラスト

こちらはまぁまぁの出来ではあります。変なところはありません。ただしプロンプトで要求した「後ろに大きなマフラー」「大きな給気口」「57番のゼッケン」は完全に無視です。

テーマ3:摩天楼にそびえる巨大ロボット

摩天楼の向こう側にそびえるつののある黒い巨大ロボット。目から殺人光線を出して、街は燃えている
A giant black robot towers over a skyscraper. The city is on fire with murder rays coming out of my eyes

摩天楼にそびえる巨大ロボット

摩天楼もロボットも合格ですが、炎が謎の場所から吹き出しています。あと気になるのはロボットが昔の超合金のおもちゃみたいなところです。


テーマ4:自動車工場の組み立てロボット

広い自動車工場のなかで自動溶接をおこなう産業ロボットのイラスト。手前にヘルメットを持った若い女性作業員が立っている
An illustration of an industrial robot that performs automatic welding in a large automobile factory. A young female worker with a helmet stands in front of her

動車工場の組み立てロボット

独特のタッチで描かれました。要求した内容にはおおよそ答えています。

テーマ5:大草原を迫りくる戦車軍団

広大な草原を向こう側から進軍してくる最新鋭の戦車軍団。季節は秋、場所は西ヨーロッパ
A state-of-the-art tank corps marches across a vast grassland from the other side. The season is autumn, and the location is Western Europe.

大草原を迫りくる戦車軍団

きちんと要求通り描かれましたが、草原も秋もあっているのに戦車がかなり旧式っぽいタイプですね。戦車兵に至っては完全に第二次世界大戦の雰囲気です。


テーマ6:暗い部屋の暖炉の前にいる老人

薄暗い部屋の奥に暖炉がある。その傍らに椅子に深く腰掛けた老人が座ってコーヒーをマグカップを持っている。老人は白髪で豊かな髭を蓄えている。

There is a fireplace in the back of the dimly lit room. An old man sitting deep in a chair was holding a mug of coffee. The old man has white hair and a thick beard.

暗い部屋の暖炉の前にいる老人

これは高いクオリティで描かれました。暖炉、マグカップ、椅子、老人、髭全てクリアしています。画像としてのクオリティも高く椅子や靴の質感が繊細に描かれています。機械についてはあまり良い結果がでていませんでしたが人物系は得意なのかと期待させます。


テーマ7:広い砂漠にいるラクダを引いた遊牧民

見渡す限りの砂漠の中にいる遊牧民。彼は白い服を身にまとい、ラクダをつれている。
Nomads living in the desert as far as the eye can see. He wears white clothes and carries a camel with him

広い砂漠にいるラクダを引いた遊牧民

砂漠、ラクダ、遊牧民と要求には一通り答えています。さらに画像としてのクオリティも高く、遊牧民の表情まで見えるほどきちんと書かれています。しかも絵としてかっこいいですね。

テーマ8:おしゃれなカフェに座るスーツの若い女性

パリの街中にあるカフェの外においてあるテーブルに座るスーツを着た若いヨーロッパ系の女性。彼女は手に小さなコーヒーカップを持ってこちらを向いて微笑んでいる。
A young European woman in a suit sits at a table outside a cafe in downtown Paris. She is looking towards me and smiling with a small coffee cup in her hand.

おしゃれなカフェに座るスーツの若い女性

こちらもしっかりと要求に答えています。ただフォーカスが効いていない感じで、少し平坦な印象を受ける画像になっています。


テーマ9:桜散る校庭に立つ女子高生

卒業シーズンの高校の校庭に桜が散って舞っている。桜の木の傍らに立って、スマホを持ってこちらに微笑みかける制服姿の女子高校生。
Cherry blossoms are scattered and dancing in the high school playground during graduation season. A high school girl in a uniform stands next to a cherry tree, holding a smartphone and smiling at us.

桜散る校庭に立つ女子高生

こちらも要求自他事項について全てきちんと答えています。しかしながら女子高校生の指がちょっとアレですね。そして気になったのはさきほどの女性もそうですがあまり美人さんではないですね。


テーマ10:桜散る校庭に立つ女子高生のイラスト

卒業シーズンの高校の校庭に桜が散って舞っている。桜の木の傍らに立って、スマホを持ってこちらに微笑みかける制服姿の女子高校生のイラスト。
Cherry blossoms are scattered and dancing in the high school playground during graduation season. An illustration of a high school girl in uniform standing next to a cherry tree, holding a smartphone and smiling at us.

桜散る校庭に立つ女子高生のイラスト

これまた独特のタッチの画像になりました。イラストはだいたいこんな感じになるんですかね。日本のアニメチックなタッチを期待していたとしたら残念な感じです。それとバックの女性たち・・・どうしても卒業帽をかぶせたがるんですねw

まとめ

全体的には機械系はチョット苦手、人物・・・特にオジサンは得意、女性は普通といった感じの結果でした。ハルシネーションもちょっと気になりました。あとイラストはこのタッチを求めているかどうかです。むしろ仕事で使うイラストであれば、このくらいがいいかもしれません。


この記事が気に入ったらサポートをしてみませんか?