ASCII以外の文字を含むファイルの検索

Question

を使用すると、要求されたgrep -Pv '[\0-\x7f]'行に-v（）ASCII文字は含まれません。これは、ASCII以外の文字を含む行とは異なります。これだけ聞いてください。

LC_ALL=C grep -lP '[^\0-\x7f]'

コードポイントの範囲ではなく、ASCIIロケールで印刷できない文字を要求できます。これはほぼ同じです（制御文字も含まれています）。

LC_ALL=C grep -l '[^[:print:]]'

同じでより洗練されたアプローチは、全体がASCII文字で構成される行を検索し、一致を逆に置き換えることです。

LC_ALL=C grep -vlP '^[\0-\x7f]*$'

Answer 1

を使用すると、要求されたgrep -Pv '[\0-\x7f]'行に-v（）ASCII文字は含まれません。これは、ASCII以外の文字を含む行とは異なります。これだけ聞いてください。

LC_ALL=C grep -lP '[^\0-\x7f]'

コードポイントの範囲ではなく、ASCIIロケールで印刷できない文字を要求できます。これはほぼ同じです（制御文字も含まれています）。

LC_ALL=C grep -l '[^[:print:]]'

同じでより洗練されたアプローチは、全体がASCII文字で構成される行を検索し、一致を逆に置き換えることです。

LC_ALL=C grep -vlP '^[\0-\x7f]*$'

おすすめ記事