見出し画像

Multilingual support, Greek letters? Πολυγλωσσική υποστήριξη, ελληνικά γράμματα;

さて、今回は前回の続きから。前回のホーンテッドなフォントにいろいろ追加していって多言語に拡張していこうというおはなし。どこまで拡張するかというのはやっていくとキリが無いけど、Statistaの調べによれば今年の1月時点でのWebコンテンツで最もよく使われる言語は58.8%が英語、次いで5.3%のロシア語、4.3%スパニッシュ、次に同率3.7%のフレンチ、ジャーマンでジャパニーズが第6位の3%、次にトルコの2.8%となるので、文字としてはほぼほぼアルファベットに支配されている。従ってまぁWebコンテンツを前提に考えるのであれば現時点ではラテン文字とキリル文字さえ用意してあれば全体の8割はなんなくカバー出来るといった寸法だ。国力では世界2位、話者の数としては世界最大を誇るチャイニーズだがLanguages most frequently used for web contentの中では1.7%と誤差レベルに存在感が無い。こういうところが覇権国家になれない理由……みたいなことをいうと、いろいろあちこちからいろんなものが飛んできそうなので、このくらいにしておくけど、そういうわけで見方にもよるけど日本語の3%というのは結構微妙な感じなんだと思う。

まぁ、そういうことなのでとりあえずラテン文字にキリル文字とギリシア文字のセットを追加して最低限その8割に対応するフォントセットを作成するという方向で作業開始。

ギリシア語に関しては言語としてのウェブサイト占有率は0.5%以下で豆粒よりも小さいのだが、ギリシア文字は、英語だろうがルーシーだろうがスパニッシュだろうが仏語だろうが独語だろうが日本語だろうが、ターキー、ペルシャン、チャイニーズ、伊、葡、越南であろうとも、そこからある程度の量の文章をすくい上げれば必ず混入してしまうというほどには必要とされている。まぁ、それらはほぼほぼ記号的な扱いしかされていないというわけなんだけれど、どうせキリル文字を拡張するなら似たようなグリフがあるので一緒に作ってしまった方がいいだろうと……そう思って始めたら思いのほかここに本気になりすぎて、ギリシア文字に関してはほぼフルセットのグリフが出来上がってしまったのでギリシア語のテキスト用途としてもまぁまぁ使用できるハズ……多分。ということで説明は、先にこのあたりの解説から始める。

ぶっちゃけ、実際のところフォントのグリフなんて、追加していこうと思えばいくらでも好きに増やせるので、グリフセットを完成するなんていうのは今回の場合はどこでその拡張を諦めるかという事でもあったりはするのだけれど、もちろん通常普通は必要に応じてセットの内容が決まるので、当然そんなアホな考え方はしない。


筆記体の場合綺麗に書こうと思ったら筆の入り方向を揃えるという必要は当然あることではあるのだが、グリフによってはそれが出来ないこともあって、そこは例外的な処理になる。ところがこういったルールを多言語に拡張していく場合ではスクリプトによっては、例外のほうが多くなることもある。そこを下手に無理遣り揃えようとするよりは、例えば「筆の入り方向を揃える」というような基本的ルールからの見直しを考えたほうがいいだろうというようになることも……まぁあるといえばないわけでもない……ということもある。
ギリシア文字を手書きした図。書き順に正解があるのかどうかそのあたりのことがちゃんとわかっていない。理屈から言えばシグマもファイナルシグマも同じ文字なので右から始めるべきなのだろうがそうでないという人もいるのでもう本当によくわからない。また、ひとつ上の図の左上のようにラウンドハンドに筆回しをすると、これはこれで……おそらく、多分、別に構わないのだろうけど、それでも右上と比べるといろいろ不自然な感じに見えなくもない。大昔、数式を手書きするときに記号がごっちゃになって後で読めなくなるからギリシア文字の筆記体とラテン文字の筆記体では回転の向きが逆になるように意識して書き分けた方が良いというようなことを言われた記憶だけはあるのだが、どういう話の流れでそういうことになったのかというところの記憶がまったく全て飛んでいるので、そこから話を膨らませて文字の書き方についてのまともな説明……というものがまったく出来そうにない。数式みたいなもののメモも後で見返して結局よくわからなくなってどう判別するのがいいのか迷ってしまったという場合、なんか、なんとなく角張って見えればラテン文字、丸っこいのがギリシア文字みたいな……いやまぁ、結局字が汚いのが本質的、基本的に一番の根本の根っこの問題なのでこういう説明だともうホントにアレなんだけど……。


ギリシア文字をどう作るかというのは、他聞に色々と見解もあって、ここでどうこうというつもりも無いのだけれど、記号としては教科書の中でも小中学校の時代から使用実績はあるはずなので日本では多くの人にはスラブの文字よりは馴染みがある……だろうと、まぁ、そこらあたりは勝手に思っていているだけなんだけど……ただそれらの文字は記号としての用途として世界中でドメスティックに勝手に文化盗用されているだけなので、あまり面倒なことを考えるとあれだけど、キリル文字とギリシア文字に関しては必要もあってからか、そこそこの、ちゃんとした、日本語グリフのフォントセットの中であれば必ずコード化されたものが利用できるようにはなっている。

まぁ、なってはいるのだけれど……ただ、これらの日本語フォントがギリシア語やロシア語の文章を表示するときに利用できるのかというと……やっても良いけど、まったくオススメはできない。ギリシア語の場合これらの日本語の文字集合の中のギリシア文字のフォントセットでは、ギリシア文字を日本向けに換骨奪胎、アプロプリエーションしているだけなので当然の事ながら基本的にはギリシア語のテキストを組むようにはまったく出来ていないからだ。細かいことを言い出すとキリが無いけどポリトニックシステムは当然としてファイナルシグマトノス付きの文字さえなかったりするものもあるので、現代ギリシア語にすらまともに対応できない。また、本文フォントやキャップスは正体なのにギリシア小文字だけ斜体になっていたり、文字が全て全角で設計されていたり、文章を並べても困ったところで改行されたりするので、0208だろうが0213であろうがJISのフォントでギリシア文字を並べるとギリシア人の5歳児の書いた文章より頭の悪いテキスト組み版が出来上がるという……極度乾燥(しなさい)という用途で使いたいというのであれば別に止めはしないのだが……ということで見て貰えばわかるけど以下のような感じになる。

左が今回自作したフォント。右がAdobeのバンドル書体。左右とも日本に関係あるちょっと前のニュースの内容をコピーした文章をほぼデフォルトのママ流して……まぁこんな感じだが、それにしても和文フォントのほうは総じて一文字一文字がでかく設計されているのでラインギャップに関してはもうどうしようもない。並べて表示を比較するためサイズを左の半分ほどにしてなんとか収めてはみたが同サイズのままだと左の4倍近い面積が必要になる。左の書体がコンデンスなのを差し引いても……いや、まぁ、そこまではいいか。


まぁ、ともかくそういう感じで、アルファーベーターの24文字を並べると以下のような感じになる。見ればわかると思うけどグリフの形もアルファベットと共通に使えるモノもあるけどアルファベットにあってアルファーベーターにない音とか小文字と大文字の形の対応にもアルファベットとは違いがある。どのあたりで妥協出来るか問題は……まぁ、これでも大分寄せたつもりはあるのだけれど、それでもラテン文字に比べるとギリシア小文字はやっぱりエキゾチックには見える。あと、デザインに関しては異体字を追加したグリフもあるけど……これも指摘される前に言い訳をしておくとトノスの痛い字については用語説明のほうに解説を追加してあるのでそちらを参照してください。

さてこのギリシア文字は3000年ほど前から使われていたものなんだけど、当然最初は発音記号なんてものは無かった……よね? まぁ多分。ただ、この文字が何世紀にもわたって各地域や様々な言語圏のあいだに広がっていって使われるようになってくる過程でダイアクリティカルマークが採用されるようになって、これが後にポリトニックシステムと呼ばれるような複雑な正書法に発展していく。このシステムは1980年代に成立した社会主義政権によって廃止されるまでは使われていたんだけれど、今やそれから半世紀近くなるので、近所の半島ほどではないにしてもネイティブでもこれで書かれたテキストの読解が困難になる程度には……まぁ、その話はいいか……で、Unicodeではギリシア語拡張ブロックにこのポリトニックギリシア語を書くために必要なアクセント付き母音のテーブルがあるので、ここをポチポチッとオクシアヴァリアペリスポメニダシアプシリ、それとイポゲグラメニディアリティカ……あ〜、あとマクロンやブレーベもいるのか……まぁそれらを組み合わせたグリフで埋めていくと、だいたい以下のような感じに収まる。

これでちょっと前のギリシア文字にも対応可能なフォントになる……細かい事を言うとまだまだ問題はあるんだけど、まぁ、いいや。あと、ギリシア語と英語を比較した場合、クエスチョンマークがラテン文字のセミコロンで、英語のセミコロンがギリシア語ではセンターやや上寄りの中黒、通常ダイアクリティカルマークは大文字の場合ディアリティカというウムラウトのような記号を除いてそれ以外は省略されるのだが、本文を小さい大文字で書く場合、つまりスモールキャップにしたときには必要になる場合があり、このケースでは大文字同様左側ではなく小文字と同様の位置に発音記号が置かれる……だとか、クォーテーションマークのプライマリー、セカンダリーがフランス語のようなルールだとか……まぁまぁ他にもいろいろとあることはあるのだけど、流石にこういうところまでキチンと整備しようと思ったらもうホビーの範疇を超えちゃうんで金貰わなきゃやってらんない……というか、うん、まぁ、ギャラが発生するなら本気で考えなくも無いんだけど……。

そういうわけで今回の作業はここまで。次回はここからさらにラテン文字のダイヤクリティカルマーク等々を追加していって、さらにワールドワイドにこのフォントを拡張していく……という予定。







信頼性に関してはChatGPT並みのいつもの用語解説

0218,0213 どちらもJISの規格名称。いろいろといいたいことは一盃あるけどソレを始めると長くなるので……まぁ、勘弁して下さい。

Statista【スタティスタ】市場調査や消費者動向に関するデータや統計を提供するオンラインプラットフォーム。2007年に創業されその2年後にはもう一部の批評家にはモンドセレクション並みと評される赤い鰊の賞を始めとして、スタートアップに関するいろいろな賞を貰っていたりもしている。本社はハンブルグにありロンドン、NY、LA、パリ、シンガポール、東京など世界中でサービスを展開、自称によると、世界150カ国、170に及ぶ業界をカバーし世界中の約23,000社がそのサービスを導入し200万人以上の登録ユーザーを誇っている……というドイツのオンライン企業。

アプロプリエーション 盗用芸術のこと。詳細は前回参照。

イポゲグラメニ【hypogegramménē】サブスクリプトのイオタ、下書きのイオタ、イオタ添字。グリフの下にミニチュアのイオタを置いて長い二重母音を表す。大文字の場合でも下に配置したままでも構わないのだが、最近の大文字は殆ど右横に配置される。また小文字の場合であっても右横に配置するケースもあり、普通にイオタを置くのと変わらんジャン……って、まぁ、それはともかく、この右横にイオタが置かれる場合、そのイオタのことはイポゲグラメニではなくプロスゲグラメニ(prosgegramménē)と呼ぶ。まぁ長いし舌を嚙みそうになるうえに覚えにくいので呼び名は小っちゃいイオタでもなんでもお好きなように……わかればいいんだよ。

ヴァリア【bareîa】グレイブアクセント記号。アクセントの欠如もしくはローピッチを示し、基本的にはオクシアと見た目で対称にデザインする。現代ギリシア語では使われない。

オクシア【oxeîa】アキュート記号同様のデザインでアキュート同様音程の上昇を示す記号。ギリシア文字の場合デザインをトノスと同じデザインに揃えてしまう……というか、トノスとオクシアをアキュートと同じにデザインしてしまうケースと、トノスはアクセントではないなどと言い張る人もいるので上の図のようにそうしないケースとか、まぁいろいろとあるにはあるのだが、そうしないケースでもオクシアとバリアとはセットで対になるようにデザインする……のが望ましい。

極度乾燥(しなさい)【Superdry】イギリスのアパレルブランド。別に無知ゆえにこうなっているというわけではないそうで、日本人の着ている恥ずかしい欧文の入ったTシャツを逆にクールだと思ってしまったJulian Marc Dunkertonが、それなら逆をやってみようということで0年代にコベントガーデンに出店したのが始まり。もっとも最近では冒険魂というなんだか微妙なキャッチフレーズに差し替わってしまってもいるのだが……まぁそういう意味ではここでやっているノリもSuperdryとたいして替わりはしない。

キリル文字【cyrillic】いいとこのお坊ちゃんでいけ好かない若き天才……と、まぁ勝手に無職転生の登場人物みたいな性格にイメージしているだけなんだけど、そのクリフ・グリモルことテッサロニキのコンスタンティノス・キュリロスによって発明されたグラゴル文字は東欧に住むスラブ人たちの言語……スラブ語を表記するのには非常によく考えられていて完成度も高かった……のだが、俺様の考えたカッコいい人工言語というものにありがちなアルアルで、大雑把に言えばわかりづらくて使いづらいので、そこから少し反省したキュリロスはギリシア文字など普通の文字を参照して簡易化していく過程で出来上がったのがキリル文字……なのだというふうにいわれていたりもする。まぁギリシア文字化はキュリロス亡き後凡夫共が勝手に作り直しただけなんだとか文字の成立過程には諸説有るのでホントの処はよくわからないのだけれど、ともかくそういうわけで、この文字のグリフはギリシア文字をベースに足らない部分を創作文字のグラゴル文字から補ってくるというスタイル……という感じなので、デザインルールもギリシア文字のものがそのまま流用できるだろうというわけで、ラテン文字とあわせ、この3つのスクリプトは成り立ち等から全てはギリシア文字に還元されるともいえるので、グリフをデザインする場合ではそれら全てはラテン文字の設計スタイルを採用可能になっている。つまり線の太さや頂点の形状、ストロークの接続から全体構造に至るまでアルファベットと全部同じに……って、まぁ、細部を言い出すといろいろあるのでなんだけど、それはともかく、キリル文字はその後にギリシア正教、ロシア帝国、ソビエト連邦の拡大と共にその周辺の民族の言語表記用の文字としても普及していくということにはなるのだが、文字が宗教や政治的スタンスと結びついてしまって見えるため連邦崩壊後は逆に嫌がられ、それら諸国諸民族の言語は代わりにアラビア文字やラテン文字、果てはもっとドメスティックな文字に戻していこうなどということになってしまう……まぁ、なんというか……今ではそういう感じにもなっている。

今回のフォントのキリル文字はこんな感じ

ダイアクリティカルマーク【Diacritic】発音区別符号。文字の上に見かけるケースが多いが、別に下だろうが、文字の中だろうが、どの位置にあってもダイアクリティカルマークはダイアクリティカルマークだ。ギリシア語の大文字の場合文字の左側に置かれ、文章の先頭にこの大文字がある場合ダイアクリティカルマークの分だけ字下げが行われるようなので、グリフ作成時にサイドベアリング(文字の側面の空間)をわざわざマイナスにしておく必要はないハズなのだけれど、書体によってはここのサイドベアリングをマイナスに設計しているものもあって、これオーソグラフィ的にはどうするのが都合が良いのかホントよくわからないんだよね……トホホ。

ダシア【dasia】アスパー、ラフブレス、有気記号。気息音のHを表示するためにHの右半分を切り取ったトっていう文字を字の上に乗せて表記していたのが始まりだそうだけれど、肝心の気息音のほうはギリシアでも二千年くらい前にはすでに失われ、その後はなんとなくそのまま惰性で使われていた……らしい……という、そういう記号。今ではだいたい、Cの向きの三日月または逆向きのオックスフォードカンマの形にデザインされ、まぁ、そのあたりは好きなようにすればいいと思うけど、どんな場合でも無気記号のプシリとは対に見えるように設計し、ヴァリアとオクシアのペアとはスタイルを変えておくという必要はある。

ディアリティカ【dialytiká】ダイアレシス、ダイエリシス、二重母音記号……とだけでいうと、いろいろと正確では無いのだがまぁだいたいでいえばそんな感じ。分音符のトレマや母音交替符のウムラウト同様対象の文字の上に点を水平に2つ打ちしたデザイン。現代ギリシア語でもディアリティカトノス(ダイアレシストノス)という形でアクセント記号のパーツとして唯一生き残っている。ちなみにトレマとディアリティカ、ウムラウトは現在では全て同じ形だが、もともとは別の言語で別の目的で使用されていて、ルーツも違い、最初は別の形をしていたものがホモグリフ(意味が違うけど見た目が同じになったグリフ)化したものなので、そういうところに気を使い出すと単純に同じデザインを使い回すのもなんだか……ってなる。まぁ、使い回しても一向に構わないのだけれど、気になるようなら気を使う必要はあるんだろうなぁ……今回はまったく気を使っているつもりは無いんだけどね。

ディアリティカ、ディアリティカトノス、ディアリティカヴァリア、ディアリティカオクシア

トノス【tónos】現代ギリシア語のアクセント記号。アキュートではないが通常デザインはアキュートと同様の形にする……のだが、ここもわかればいいと言うことでもあるのか、デザイン的にはただのドットで代用してしまうケースがありギリシャのアエラこと週刊誌のTo Vima(ΤΟ ΒΗΜΑ)ではタイトルどころか本文書体までドットで埋め尽くされている。ただ中道左派のやることなので保守派には気に入られていない所為か、この表記法は間違っているとか、やってはいけないとかと嫌われてそういうことを指摘されることは度々ある。今回のフォントではそんな感じで「人の嫌がることは率先して行う」の精神でAlternateのバリエーションで、このドット化したトノスの利用も可能になっている。

ファイナルシグマ【word-final sigma】文末のシグマ。シグマの小文字は睫毛の付いた丸だがファイナルはよだれを垂らした三日月型、ギリシア語ではワードの最後にシグマが付くときのみ字形変化が起こるので、このグリフが必要になる。Unicodeのシステム的にはこの二つのシグマにはそれぞれ別のコードが割り当てられていてその位置がコードの並び順で言うとファイナルが普通のシグマの前に陣取っているため、JIS等の規格のようにこの文字に対しての割り当てが無い文字コードからのギリシア文字のコード変換を単純に頭から1づつ足し算していくという方法でプログラムしてしまうと……途中でコケるということになるという、そういうトラップの一つになっている。

プシリ【psili】レニス、スームーズブレス、無気記号。ダシアと逆向きで、通常は二重母音の融合を示すコロニス(クラシス)記号とデザインは同じにして、そこに区別を付けないが、コロニスが単語の先頭に付くことは無いので……まぁ、つまり、プシリと位置が被らないので見る人が見れば記号的区別はつくのでコロニスと無理にデザインを変える必要は多分ない。

ペリスポメニ【perispōménē】サーカムフレックス。ギリシア文字のサーカムフレックスは楔形ではなくチルダ、もしくは反転したブレーベのスタイルで描画され、多分ぶっちゃけどっちでもいいはず。ただ、デザインの都合でプシリやダシアなんかと組み合わせるときのみ場合によっては圧縮の効きやすい逆ブレーベスタイルを利用してそれ以外の時はチルダにするとかなんとか、そんなようなよくわからない謎ルールが発揮されていたりとかする場合もあるので……まぁ、そのあたりは好きにすればいいのだと思うけど……。

それぞれペリスポメニとペリスポメニプシリの異体字

ポリトニックシステム【polytonic system】前にも言ったような記憶があるけど、ギリシア語での正書法は紀元前から多くの発音記号を駆使したかなり複雑な表記ルールを発展させていたというわけで、これを総してポリトニックシステムというのだけれど、現代ではこのシステムは破棄され、音韻も失われ、表記する意味も語源をあきらかにする程度の意義しかなくなったので気息記号も消え、記号はアクセント記号として見ても少し微妙な使われ方のトノス一つに簡素化され、発音記号としての意味も薄れ大文字だけで表記する場合にはその簡素化されたトノスすら表記しない……つまりΜαΐου 2023とするところをΜΑΪΟΥ 2023……さらにはダイアレシスまで削ってΜΑΙΟΥ 2023でもオッケー……みたいな……そんな感じになってしまっている。まぁともかく、ギリシアだろうがギリシャだろうがどっちでもわかればいいということになったので過去のものに……とはいっても実際ホントのトコロははどっちでもいいというわけでもないということもあったりするということもあったりはするんだけど。




この記事が気に入ったらサポートをしてみませんか?