複数のISOエンコーディング、つまりISO-8859-6でエンコードされた文字とISO-8859-1でエンコードされた一部の文字(ISO-8859-6にはその文字がないため)を含むアラビア語ファイルがあります。ファイル全体をutf-8に変換したいです。だから私が試したのは、ファイル全体を.txtを使用してISO-8859-1に変換し、iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop
.txtを使用してutf-8に変換することでしたiconv -f ISO-8859-1 -t UTF-8 fileop>finalfile
。しかし、結果はまだUTF-8でエンコードされたアラビア語ではなく、奇妙な文字にすぎません。エンコーディングを統合してUTF-8形式を取得する方法はありますか?それ以外の場合、utf-8システムでは機能しないため、sedを使用せずにISO-8859-1をどのように削除できますか?
複数のISOエンコーディングを含むファイル
おすすめ記事
- ローカル破損したファイルの回復
- データを失うことなくDebian 8.6でLVMディスクのサイズを変更する方法
- Linuxでは、UDPはFTP、SCPなどよりも優先されます。
- 行番号に基づいて大容量ファイルを分割して実行し、最終出力をファイルに追加します。
- ls -aをls -Aにマッピングする
- SSHトンネルを介してアクセスできるように、起動中にログインせずにx11vncを開く方法は?
- htopを使用して特定の割合を超えるメモリを消費するプロセスのみを表示する方法
- bashは、histappendがonに設定されていても履歴を上書きします。
- stderrをstdoutにリダイレクトしてからパイプ(apt-cache)する方法
- この例では、列グループでソートし、他の列を無視することは失敗します。なぜですか?