見出し画像

3つのハイフン"-"のような記号

MathML Coreを読んでいくと(正確には、日本語訳するために元データを読み解いていくと)、3つのハイフン"-"のような記号に出会います。なお、3つのうちの1つはハイフン"-"です。

  • ハイフンマイナス
    1つは、一般的にキーボードの"-"キーで入力できるハイフンで、ユニコードではハイフンマイナス(U+002D)と呼ばれています。id属性の中などで使われています。

  • マイナス記号
    もう1つは、引き算や負の数を表すマイナス記号(U+2212)です。こちらは、例えば"minsize - Tascent"といった計算の過程で使用されています。

  • Emダッシュ
    最後の1つは、多くのフォントでアルファベットのmの幅に相当するEm幅のダッシュ(U+2014)です。こちらは、"Information technology - Coding of audio ・・・"といった具合に引用した参考文献の名称を表すのに使われています。

これらの3つのハイフンは、MathML CoreがUTF-8で書かれているために使い分けることができています。以前だと、マイナス記号Emダッシュは、やむを得ずハイフンマイナス"-"を使用するか、文字参照を利用して入力する必要がありました。

xyzzyでUTF-8を利用する

実は筆者は、日本語訳を作成するのに、xyzzyという古めのエディッタを使用しています。xyzzyでは、クリップボードエンコーディングの既定値がShift_JISになっています。そのため、そのままだとマイナス記号Emダッシュを正しく認識できずコピーすることができません。正しく認識させるには、クリップボードエンコーディングUTF-8に変更してやる必要あります。
さらに、クリップボードエンコーディングの既定値をUTF-8に変更するには、xyzzyが起動時に読み込む".xyzzy"に下記の1行のコマンドを加えることで実現できます。ただ、この設定を行うと、コピーは正しく行えるのですが、検索ダイアログへの貼り付けでは文字化けしたりもします。

(setq-default *clipboard-char-encoding* *encoding-utf8n*)

この記事が気に入ったらサポートをしてみませんか?