ディレクトリBASHのスペース数の計算

Question

-l改行（）、単語（）の数を数えます-w。ここでは、wc空白ではなくシーケンスです。数値したがって、単語はスペースまたは非文字）、文字（-m）、およびバイト（-c）で区切られます。次のようにできます。

find . -type f -exec cat {} + | wc -lwmc

ただし、ファイルの関連付けによってcatスペースで終わらないファイルがある場合は、誤った単語と文字の計算結果が表示されることがあります。特徴（テキストファイルは空白文字の改行で終わる必要があります。）これは、2バイトを1つの有効な文字に連結するか、2つの単語を一緒に連結する可能性があるためです。

例:

$ od -tx1 a
0000000 c3
0000001
$ od -tx1 b
0000000 a9
0000001
$ wc -m a b
0 a
0 b
0 total
$ cat a b | wc -m
1

$ printf foo > a
$ printf bar > b
$ wc -w a b
1 a
1 b
2 total
$ cat a b | wc -w
1

空白文字を計算するには、POSIXlyで次のことができます。

find . -type f -exec cat {} + | tr -cd '[:space:]' | wc -m

（再び、バイトを文字で連結するには注意が必要です。）しかし、GNUではtrこれは単一バイト文字でのみ機能することに注意してください（したがって、UTF-8でエンコードされた非ASCII文字は該当しません）。

GNUシステムでは、GNUを使用して以下をgrep使用できます。

grep -rzo '[[:space:]]' . | LC_ALL=C tr -cd '\0' | wc -c

ただし、NULで区切られたレコードで機能するため、-z最終的にgrepメモリ内のフルテキストファイルを占有します（テキストファイルは通常NULバイトを含まないためです）。

Answer 1