コンピュータの文字コードの勉強をしましょう(感想募集)
コンピュータで扱う文字には番号(文字コード)が割り振られています。
このあとに,その説明と問題があります。答えを考えてください。その感想を募集します。
文字コードは16進数で表すことが多いのですが,16進数では,0から9までの数字に加え,アルファベットのAからFまでを使って表します。
半角のアルファベットや数字は,アスキーコードというもので次の表のように表されます。
ある文字のコードを探すには,まず右へ進んで数字を読み(上のピンクのところ),次に下に進みます(左の紫のところ)たとえば,小文字の m は 6D となります。これを「1バイトで表示されている」といいます。16進数の2桁です。
漢字やひらがなは,次の表のようにシフトJISコードやユニコード(UTF-8)で表されます。
たとえば,「阿」のコードはシフトJISでは88A2,UTF-8ではE998BFです。
さて,テキストエディタ(文字だけの編集をするソフトウェア)で,次のように文を打ちました。まず tokyo と打って,enterキーを押して改行し,次の行に東京都港区と打ちました。
これをファイルにして,どのように保存されているかを見るソフトを使って中身を見てみました。
文字コードをシフトJISにすると次のようになりました。
左右を比較すると,t のコードは 74 であることがわかります。
アスキーコードの表で確かめましょう。
文字コードをUTF-8にすると次のようになりました。
では問題です。
(1) 「港」のシフトJISコードは何ですか
(2) 「港」のUTF-8コードは何ですか
(3) アルファベットや漢字の文字コードでないものが2つあります。それはどのコードで,何を表しますか。
(1) 答え (2) 答え (3) ( )と( )で,( )を表す
のように答えてください。正解はこのあとスクロールしていくとでてきます。
どうでしょうか。初めの「16進数」で「え?わからん」となった人や,「バイト」などの用語で困った人もいるでしょう。初めて見る用語で戸惑うのはふつうです。また,問題を見て,「やさしい」と思う人,「何でこれが問題? 何かのクイズみたいに,答えが書いてあるじゃん」と思う人,「(1)(2)はいいが(3)は何?」という人,「わかわかめ」の人,いろいろいると思います。わからないという人,構いません。その理由はあとで(次回)書きます。
正解を示します。中身を見た結果を再掲しておきます。上がシフトJIS,下がUTF-8です。
(1) 8D60 (2) E6B8AF (3) ( 0D )と( 0A )で,( 改行 )を表す
合っていましたか。では,感想をお願いします。コメント欄に書いてください。「楽勝」「難しい」「さっぱりわからない」「なんじゃこりゃ」「ほげ」・・・ など,何でも結構です。
=============
追記:E8 -> E6 ミスタイプ直しました。