見出し画像

主要文字コード丸わかり! - 2795文字

以下は文字種類で降順にしたものである。


1.大規模文字集合

Unicode

• Unicode: 多言語対応

ISO/IEC 10646(UCS、JIS X 0221)

• ISO/IEC 10646-1とISO/IEC 10646-2はISO/IEC 10646:2003で統合された。
• JIS X 0221-1はJIS X 0221:2007で改訂された。
• JIS X 0221のうち、「日本文字部分レパートリ」はJIS X 0221 附属書JAという制限部分集合として定義。

10464

Unicode の文字符号化方式

• UTF-8: 多言語対応
• UTF-16 文字符号化形式
• UTF-16: 多言語対応
• UTF-16BE: 多言語対応
• UTF-16LE: 多言語対応
• Compatibility Encoding Scheme for UTF-16: 8-Bit(CESU): 多言語対応
• UTF-32 文字符号化形式
• UTF-32: 多言語対応
• UTF-32BE: 多言語対応
• UTF-32LE: 多言語対応
• UTF-7: 多言語対応
• UTF-EBCDIC: 多言語対応
• Standard Compression Scheme for Unicode(SCSU): 多言語対応
• Binary Ordered Compression for Unicode(BOCU-1): 多言語対応

Unicode

2.2バイト系符号化文字集合

• JIS X 0208 - 日本。(第一・第二水準漢字など): 日本語
• JIS X 0212(補助漢字など): 日本語
• JIS X 0213(JIS X 0208 に第三・第四水準漢字などを追加した文字集合。JIS X 0213:2004はJIS2004とも呼ばれる): 日本語
• GB 2312 - 中国の簡体字中国語: 中国語(簡体字)
• GB 18030 - 中国: 中国語(簡体字)
• KPS 9566 - 朝鮮語が使われる北朝鮮: 朝鮮語
• KS X 1001(KS C 5601) - ハングルなどが使われる韓国: 韓国語
• Big5 - 繁体字中国語: 中国語(繁体字)
• CNS 11643 - 台湾: 中国語(繁体字)

2バイト系符号化文字列

3.文字符号化方式と文字コード(キャラクタセット)

ISO/IEC 2022系

• ISO-2022-JP(RFC 1468、俗に「JISコード」と呼ばれる文字コード。JIS X 0208対応): 日本語
• ISO-2022-JP-1(RFC 2237、JIS X 0208とJIS X 0212に対応): 日本語
• ISO-2022-JP-2(RFC 1554、多言語拡張。JIS X 0208、JIS X 0212、GB 2312、KS X 1001、ISO/IEC 8859-1、ISO/IEC 8859-7対応): 日本語、中国語、韓国語、ギリシャ語など
• ISO-2022-JP-3(JIS X 0213:2000対応): 日本語
• ISO-2022-JP-2004(JIS X 0213:2004対応): 日本語
• ISO-2022-CN(RFC 1922、GB 2312、CNS 11643[第一字面・第二字面]対応): 中国語(簡体字・繁体字)
• ISO-2022-CN-EXT(RFC 1922、GB 2312、ISO-IR-165、CNS 11643[第一字面から第七字面]対応): 中国語(簡体字・繁体字)
• ISO-2022-KR(RFC 1557、KS X 1001対応): 韓国語

2022系

EUC(拡張 UNIX コード)

• EUC-JP(JIS X 0208 対応): 日本語
• EUC-JISX0213(JIS X 0213:2000対応): 日本語
• EUC-JIS-2004(JIS X 0213:2004対応): 日本語
• EUC-KR(RFC 1557、KS X 1001対応): 韓国語
• GB2312(別名EUC-CN。GB 2312対応): 中国語(簡体字)
• GBK(Microsoft Windows Codepage 936対応): 中国語(簡体字)
• GB18030(GB 18030対応): 中国語(簡体字)
• EUC-TW(CNS 11643対応): 中国語(繁体字)

EUC

シフト符号化表現

• Shift_JIS(JIS X 0208対応): 日本語
• Shift_JISX0213(JIS X 0213:2000対応): 日本語
• Shift_JIS-2004(JIS X 0213:2004対応): 日本語
• Windows-31J(Microsoftコードページ932対応): 日本語
• x-Mac-Japanese(MacJapanese対応): 日本語

シフト符号化

その他の文字符号化方式

• HZ-GB-2312(RFC 1842、RFC 1843、GB 2312対応): 中国語(簡体字)

その他文字符号化方式

4.1バイト系文字コード(符号化文字集合)

• US-ASCII(ASCII [ANSI INCITS 4] 対応): 英語
• ISO/IEC 646: 国際規格のASCII(複数言語対応)
• ISO646-JP: 日本語


• ISO/IEC 8859(ISO/IEC 8859-1 〜 ISO/IEC 8859-16): ヨーロッパ言語

• ISO-8859-1(ISO/IEC 8859-1 対応): 西ヨーロッパ言語
• ISO-8859-5(ISO/IEC 8859-5 対応): キリル文字
• ISO-8859-6(ISO/IEC 8859-6 対応): アラビア文字
• ISO-8859-7(ISO/IEC 8859-7 対応): ギリシャ文字
• ISO-8859-11(ISO/IEC 8859-11 対応): タイ文字
• ISO-8859-15(ISO/IEC 8859-15 対応): 西ヨーロッパ言語(ユーロ記号追加)

8859

• windows-1252(Microsoft Windows Codepage 1252 対応): 西ヨーロッパ言語
• macintosh(MacRoman 対応): 西ヨーロッパ言語
• KOI8-R: ロシア語
• KOI8-U: ウクライナ語
• TIS-620: タイ語
• EBCDIC: IBMの多言語対応
• JIS X 0201(JIS ローマ字、カタカナ): 日本語

詳しくは以下を参考にしてください!!

以上

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?