見出し画像

暗号探偵クラブ(6)

こんにちは、俺です。文くんです。
コンピュータは0と1の2進数だの、16進数と相性が良いだのと、話は聞いていたはずなのに、実際にやってみないと、なかなかつながらないものだなとしみじみしています。

「あれ、ちょっと待って。日本語だと、もっとたくさん文字があるよね」

「そうだね、ひらがなとカタカナだけでも100個以上あるね。漢字も入れたら数えきれない」

「文字、どうやって保存してんの?」

スーはうふふと笑った。

「コンピュータの保存の単位が、この1文字分なのね。電気のONとOFFの1つずつをビットっていうんだけど、8ビットが1バイト。日本語は文字がいっぱいあるので2倍の2バイト使うのだ」

「あれ、もしかして、全角半角の切り替え?」

「そう!実際のフォントの時にも、表示の横幅も2倍必要になるから、イメージしやすいよね。ちなみに、日本語のデータはこうなる」

画像2

「日本語の方が短い!?」

「だって、文字数が少ないもん。1文字に対して1つの文字コードだから、漢字の『一』みたいなシンプルな文字もうつ病の『鬱』みたいなすごい字画数の文字も、データにしたら同じ大きさだよ」

「2列で、1文字・・・だよね」

「うん」

「あ、確かに『と』って2回出てくるけど、対応する位置の3~4列目と6~7列目は同じ穴のあき方して」

「うん。画面に『と』って文字を表示するためのコードが保存されてるの」

画像3

「うげ、え、ちょっとまって。『と』はすぐみつかるけど、漢字は多すぎてどこにあるか見つけられないぞ」

「逆算すればいいじゃない。穴のあいているところを先に入れちゃおう」

「逆からか・・・よし!01001111、11111010・・・おうう、横方向の0が見にくい・・・しかもなんで、この横棒4と4じゃなくて5と3なんだよ・・・意地悪かよ・・・」

「なんでか、人間にとっては4よりも5の方が切りが良く感じられるし、アメリカの数字表記だと3桁区切りでカンマ入れてくるからねえ」

「うええ・・・次の2列は『と』だからいいとして、次は・・・」

何も穴がない部分は平坦で、0があるのかないのかわかりにくい。パソコンの画面にペンを横にして当てて、何とかして数えていく。

画像4

「で・・・できた。何回も、今どこ見てんのかわかんなくなった」

「じゃ、これを16進数に直して、IMEパッドで探してみよう」

「容赦ないな」

画像6

「・・・これでよし。さて、見つかるかな『4FFA』・・・っと」

画像5

「あった、『俺』だ。うん?文字カテゴリって何だ?『CJK統合漢字』・・・?」

「Cはチャイナ(中国:China)、Jはジャパン(日本:Japan)、Kはコリア(韓国:Korea)だね。その辺で使われてる漢字はこのフォルダに入れとくよって感じかな」

「ざっくりまとめられた」

IMEパッドを上下左右へとカチカチスクロールをして、全部の漢字の文字コードを確かめた。一応、全部の漢字が「CJK統合漢字」の中にあった。
「俺」が最初の方にあって、「猫」が一番下の方にあるとか、どういう順序で並んでいるんだかさっぱりわからないが、たくさん入っていることだけはよ~くわかった。

この記事が気に入ったらサポートをしてみませんか?