見出し画像

生成AIは『たぬき』を知らない!? こういうデータの偏りが子供たちに影響する未来になる!!

『だれにでもわかるNFTの解説書』の著者、密かに絵本作家になっている足立明穂ですw さらに、小説を書こうとしていて、もう、何をしてるんだか(^^;

さて、先日、とある方のご縁で、滋賀県の信楽に行ってきました。

信楽と言えば、たぬきの置物が有名ですよね。

信楽は甲賀市にあるので、忍者も有名なのですが、今回は置いといて・・・・

今回は、『たぬき』。

この『たぬき』なのですが、日本の固有種でもあり、これがどうして、なかなかに、海外の方々には分からないのですよねぇ・・・

それが、AIを使ってみると、如実に分かるって話。そして、こういったことのデータの偏りが、これから学校教育でAIを使い始めると影響を受けていくということは知っておかないとね!

ってことで、今回は、AIのデータが偏っていることで、ますます(?)日本、いや、世界が西洋化していくのではないか?ということを考えてみたいと思います。

AIを使う前に、絵文字を探してみよう!!

日本発祥の絵文字が、emojiになり世界に広まっています。

絵文字だけで、あの名作『白鯨』や『不思議の国のアリス』も翻訳(?)されているのですよ!!

それぐらい、世界に浸透し、コンピュータで共通に使える『文字』として、emojiと呼ばれるようになっています。

いろいろな絵文字がすでに使えるようになっていますよね。

ちょいとチャットGPTに調べてもらいました。

動物の絵文字の一覧を出してくれますか?

もちろんです!以下に一般的な動物の絵文字の一覧を示します(Unicodeのコードポイントに基づいています)。ただし、表示されるかどうかは使用しているデバイスやプラットフォームに依存するため、すべての絵文字が正しく表示されるわけではありません。

🐶 ドッグフェイス 🐱 キャットフェイス 🐭 マウスフェイス 🐹 ハムスター 🐰 ラビットフェイス 🦊 キツネの顔 🐻 ベアフェイス 🐼 パンダの顔 🐨 コアラの顔 🐯 タイガーフェイス 🦁 ライオンの顔 🐮 ウシの顔 🐷 ブタの顔 🐽 ブタの鼻 🐸 カエルの顔 🐵 猿の顔 🙈 目を覆う猿 🙉 耳を覆う猿 🙊 口を覆う猿 🐔 ニワトリ 🐧 ペンギン 🐦 鳥 🐤 雛の顔 🐣 ひな鳥 🦆 アヒル 🦅 ワシ 🦉 フクロウ 🦇 コウモリ 🐺 オオカミの顔 🐗 ヤギ 🐴 馬の顔 🦄 ユニコーンの顔 🐝 ハチ 🐛 イモムシ 🦋 バタフライ 🐌 カタツムリ 🐞 テントウムシ 🐜 アリ 🦟 ハエ 🦗 キリギリス 🕷 クモ 🦂 サソリ 🐢 カメ 🐍 ヘビ 🦎 トカゲ 🦖 恐竜 🐊 ワニ 🐡 フグ 🐠 熱帯魚 🐟 魚 🐬 イルカ 🐳 クジラ 🦈 サメ 🐋 クジラの尾

この一覧は一部であり、他にもさまざまな動物の絵文字が存在します。また、新しい絵文字が追加されることもあるため、最新の一覧を確認する際にはUnicodeや各プラットフォームのドキュメントを参照してください。

いろいろ、ありますよね。

でも・・・ よーーーーく見ると、🦊きつねは、あるのですが、『たぬき』は存在しないのです!!

タヌキの絵文字ってありますか?

はい、タヌキの絵文字があります。Unicodeでは、タヌキの絵文字は次のように表されます:

🦝 タヌキの顔

この絵文字は、一般的なタヌキの顔のイメージを表現しています。ただし、表示されるかどうかは使用しているデバイスやプラットフォームに依存するため、すべての絵文字が正しく表示されるわけではありません。

こらーー! それは、アライグマやろーーー!w

それは、アライグマですよね?

おっしゃる通り、失礼しました。🦝絵文字はアライグマの顔を表しています。アライグマは英語で「raccoon」と呼ばれ、タヌキとは異なる動物です。申し訳ありませんが、Unicodeの標準絵文字としては、現時点ではタヌキの絵文字は存在しません。ご指摘ありがとうございます。

ぬぬぬっ・・・・。『たぬき』の絵文字は存在しないのです。

ということは、日本の昔話『ぶんぶく茶釜』とか『かちかち山』とかは、emoji文学になりえないのです!!

日本発祥の絵文字なのに、日本人なら誰もが知る『たぬき』が絵文字になっていないとは!!

これは、かなり由々しき問題です!!!w

スレッズでも、この事件とでもいえる内容を投稿しておきました!w


『たぬき』を生成AIに描かせてみよう!

さて、ここからが本題(なのか?w)。

画像生成AIは、『たぬき』を描いてくれるのでしょうか?

まず、私が絵本作家として(?)使っているのは、BingAIのImageなので、これで試してみます。

理由は簡単で、日本語で指示ができるから!

マイクロソフトのEdgeからしか使えないってのはありますが、日本語が使えると微妙な指示とかやりやすいので、私はよく使っています。

では、さっそく、たぬきを描いてもらいましょう。

『たぬき』

残念! それは、アライグマですから!!!

これ、よくあることで、たぬき=racoonと翻訳してしまうと、アライグマになっちゃうのですよね。

そこで、間違わないように『日本のたぬき』と指示してみましょう。

えっ? えっ? 不適切なコンテンツ???

『日本のたぬき』って表現しちゃいけないものなの???

じゃあ、『tanuki』ではどうでしょうか?

いや、それは、アライグマ!! 『tanuki』って書いても、アライグマって解釈しちゃうんですねぇ・・・。

ということで、『Japanese tanuki』と指示。

あぅ・・・ またしても、不適切なコンテンツ・・・。

日本のたぬきって、そんなにもNGなものなの???

これ、何を学習してきたのか分からないのですが、なにか偏ったデータを学習したようで、ちょっと怖くないですか?

以前、『笑顔の女の子』について書きましたが、ほんと、こういうのが偏った知識や経験になって染み着いていくのですよね。

学校教育で、子どもたちに使わせるようになると、知らぬ間に西洋文化に染まっていく・・・

今回のように、子どもたちが生成AIで、『たぬきがお腹を叩いて、ぽんぽこと音が出て、みんなが楽しく踊っている様子』って指定して描かせたら

アライグマが出てきて、これを良く知らないと、『かわいいーーー!』ってなって、これが『たぬき』だと思ってしまいますよね。

大規模言語モデルと呼ばれる学習データを作るのには、莫大なデータを学習させるので、データを収集したり、その形を整えたり、莫大なコンピュータリソースを消費したりと、そうとうの予算がかかります。

すでにチャットGPTなど、世界にはさまざまな学習データセットがあるので、わざわざ日本で作る必要があるのか?という意見がありますが、私は、絶対に日本で作るべきだと思っています。

このままでは、『たぬき』=『アライグマ』という認識になってしまう日本人が増えていきます。

「そのぐらい、大したことじゃないじゃん」

って、思いますか??

日本の縦書という文化も消えてしまう、いや、縦書きした看板を自動運転の車が認識できず、事故を起こす可能性だってるのです。

そうなってくると、『縦書の看板を設置したのが悪い』ということにもなりかねません。

笑いごとではなく、他にも、気が付いていない偏見や独断がAIに学習されていくことになるのです。

なかなか気が付かないからこそ、『AIを使わない』のではなく、大人たちがしっかりと使い倒して、AIの偏見や独断を修正していかなければならないと思うのですよね。

ちなみに、『信楽焼のたぬき』って描かせたら

なじゃ、これーーーーー!!

信楽の方々、これは、怒っていい事案です!!w

(でも、ちょっと、かわいいw)



この記事が気に入ったらサポートをしてみませんか?