不足または一致しない文字を防ぐには、どの中国語ロケール設定が必要ですか?

不足または一致しない文字を防ぐには、どの中国語ロケール設定が必要ですか?

Arch Linuxには、次のようなさまざまな中国語ロケールがリストされています/etc/locale.gen

#zh_CN.GB18030 GB18030
#zh_CN.GBK GBK
#zh_CN.UTF-8 UTF-8
#zh_CN GB2312
#zh_HK.UTF-8 UTF-8
#zh_HK BIG5-HKSCS
#zh_SG.UTF-8 UTF-8
#zh_SG.GBK GBK
#zh_SG GB2312
#zh_TW.EUC-TW EUC-TW
#zh_TW.UTF-8 UTF-8
#zh_TW BIG5

これらのロケールは地域によって異なりますが、日本と韓国は含まず、中国、香港、シンガポール、台湾を表しますが、地域ごとに複数のロケールがあります。

漢字は体系的ではなく使用領域が広いため、漢字をUTFに組み込むプロセスは容易ではありません。使い方は地域によって異なります。同じ漢字には様々な変形があり、政治的、文化的要因も作用し、同じ地域内でも人々は筆記体だけでなく公式漢字よりも特定の漢字の変形を好むこともあります。

いくつかの技術的な問題の説明ここ素人の観点から。

私が理解しているように、繁体字中国語と簡体字中国語の同じ文字(「you」など)と「簡体字」または「繁体字」という同じカテゴリの同じ文字の異なるバリアントは同じコードポイントを持ち、文字バリアントは異なる方法で使用されます。 。フォントが実装されました。

代わりに、十分に異なるバージョン(たとえば、「from」や「from」などのさまざまな単純化および伝統的な文字)には異なるコードポイントがあるため、同じ文字の複数のバージョンを同じフォントに含めることができます。

これらの互いに絡み合った特性(簡体字、繁体字、および文字のバリエーションはすべてUTFに含まれています)は、中国語でなぜこれらのさまざまなロケールが必要なのか、ユーザーがそれらをすべてインストールする必要があるのか​​という質問につながります。


十分なフォントがインストールされているシステム(各文字を表示するためにシステムにグリフがあります):

ほとんどの文字を正しく表示するには、どのロケールが実際に必要ですか?

どの中国語エンコーディングが別のエンコーディングにマージされましたか?たとえば、UTFはBig5やASCIIなどの他の中国語エンコードと逆互換されますか?

ベストアンサー1

私は中国の政治と中国の知識の欠如を避けるために西洋の例を使用します。

おすすめ記事