混合エンコーディング

2024-06-10 • tag-icon

emacs character-encoding gedit

さまざまなエンコーディングが混在したテキストの場合、すべてのエンコーディングを見つける方法はありますか？ utf8のような単一のエンコーディングに変換しますか？

別のソース（おそらく別のエンコーディングを使用）をgeditの下のテキストファイルにコピーしました。驚くべきことに、エンコードミックスについて考える必要はほとんどありません。理由を知りたいですか？

ところで、emacsでそのようなファイルを開くと、この問題に直面する必要があるようです。

別のソースからコピーしてemacsからテキストファイルを作成し、geditでそのテキストファイルを開くと同じですか？つまり、emacsでは動作しますが、geditでは動作しませんか？

これは不可能だから有効範囲異なるエンコーディングのデータは重なっているため、どのテキスト部分にどのエンコーディングがあるかを明確に確認することはできません。

この答えは気に入らないかもしれませんが、私の考えではこれが本当です。

おすすめ記事