複数のISOエンコーディングを含むファイル

複数のISOエンコーディングを含むファイル

複数のISOエンコーディング、つまりISO-8859-6でエンコードされた文字とISO-8859-1でエンコードされた一部の文字(ISO-8859-6にはその文字がないため)を含むアラビア語ファイルがあります。ファイル全体をutf-8に変換したいです。だから私が試したのは、ファイル全体を.txtを使用してISO-8859-1に変換し、iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop.txtを使用してutf-8に変換することでしたiconv -f ISO-8859-1 -t UTF-8 fileop>finalfile。しかし、結果はまだUTF-8でエンコードされたアラビア語ではなく、奇妙な文字にすぎません。エンコーディングを統合してUTF-8形式を取得する方法はありますか?それ以外の場合、utf-8システムでは機能しないため、sedを使用せずにISO-8859-1をどのように削除できますか?

ベストアンサー1

おすすめ記事