見出し画像

[2024年05月]C言語でUTF-8を扱う(扱いたい -> しかも楽に)

C言語でマルチバイト文字を扱うのは、少々面倒です。
かつての shift-jis euc-jp であればライブラリも充実していて頭を悩ますことはないのですが、現在はUnicodeを使うのが普通です。
まぁ、Webでの通信の関係もありUTF-8を扱える必要があります。
C言語で可変バイト長文字のUTF-8を扱うのは大変です。

放棄

放棄する訳にもいかないので何かライブラリがないか探索します。
Julia言語方面でutf8procがありました。
これを使うのが良さそうです(ありがたや)。
https://juliastrings.github.io/utf8proc/

ドキュメントはこちらに
https://juliastrings.github.io/utf8proc/doc/index.html

理解して使えるようになっておこうと思います。

この記事が気に入ったらサポートをしてみませんか?