ファイルでASCII以外のUTF-8文字をすべて0に置き換える方法

ファイルでASCII以外のUTF-8文字をすべて0に置き換える方法

ソースはUTF-8のみです... ASCII文字セット(コードポイントU + 0000〜U + 007F)を除くすべてのUTF-8文字は、次の行に示すように0に置き換える必要があります。

This is line 001122��33
this is second line ¿½1122ï

これは次のように置き換える必要があります。

This is line 0011220033
this is second line 00112200

これは手動で実行するために使用する形式です。

grep -P "[^\x00-\x7F]" filename

ベストアンサー1

Perlが救出に来る!

perl -C -pe 's/[\x{80}-\x{ffffffff}]/0/g'
  • -p入力を1行ずつ読み、各コード行を実行し、処理後に印刷します。
  • -CUTF-8 オン

おすすめ記事