複数のISOエンコーディングを含むファイル

2024-06-21 • tag-icon

複数のISOエンコーディング、つまりISO-8859-6でエンコードされた文字とISO-8859-1でエンコードされた一部の文字（ISO-8859-6にはその文字がないため）を含むアラビア語ファイルがあります。ファイル全体をutf-8に変換したいです。だから私が試したのは、ファイル全体を.txtを使用してISO-8859-1に変換し、iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop.txtを使用してutf-8に変換することでしたiconv -f ISO-8859-1 -t UTF-8 fileop>finalfile。しかし、結果はまだUTF-8でエンコードされたアラビア語ではなく、奇妙な文字にすぎません。エンコーディングを統合してUTF-8形式を取得する方法はありますか？それ以外の場合、utf-8システムでは機能しないため、sedを使用せずにISO-8859-1をどのように削除できますか？

複数のISOエンコーディングを含むファイル

ベストアンサー1

おすすめ記事