混合エンコーディング

混合エンコーディング

さまざまなエンコーディングが混在したテキストの場合、すべてのエンコーディングを見つける方法はありますか? utf8のような単一のエンコーディングに変換しますか?

別のソース(おそらく別のエンコーディングを使用)をgeditの下のテキストファイルにコピーしました。驚くべきことに、エンコードミックスについて考える必要はほとんどありません。理由を知りたいですか?

ところで、emacsでそのようなファイルを開くと、この問題に直面する必要があるようです。

別のソースからコピーしてemacsからテキストファイルを作成し、geditでそのテキストファイルを開くと同じですか?つまり、emacsでは動作しますが、geditでは動作しませんか?

ベストアンサー1

これは不可能だから有効範囲異なるエンコーディングのデータは重なっているため、どのテキスト部分にどのエンコーディングがあるかを明確に確認することはできません。

この答えは気に入らないかもしれませんが、私の考えではこれが本当です。

おすすめ記事