BASH：文書の各行の単語数を計算する

Question

file2の単純な形式とスペースで区切られた単語の場合は、次のことを試してください。

$ awk '{print NF}' file2
4
4
4

awk ではNFフィールド数です。デフォルトでは、awk では単語文字はスペースで区切られます。

:file1の場合、単語はコロンまたはスペースで区切ることができるため、フィールド区切り文字に以下を追加する必要があります。

$ awk -F'[: \t]+' '{print NF}' file1
5
5
5

改善する

行に先行または末尾のスペースがある場合、awk は追加フィールドがあると想定します。 file1と同様に、フィールドを計算する前にこれらのスペースを削除することでこの問題を解決できます。

awk -F'[: \t]+' '{gsub(/^[: \t]+|[: \t]+$/, ""); print NF}' file1

またはfile2は次のようになります。

awk '{gsub(/^[[:space:]]+|[[:space:]]+$/, ""); print NF}' file2

正規表現では、前の^[[:space:]]+スペースと[[:space:]]+$末尾のスペースと一致します。コマンドでその組み合わせを使用すると、gsub両方が削除されます。

一般化する

フィールド区切り文字が - |: またはいずれかである場合は、以下を使用します。

awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}'

例:

$ cat file3
| [email protected] | er34532 |  
| [email protected] | 764474 |
$ awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}' file3
2
2

Answer 1

file2の単純な形式とスペースで区切られた単語の場合は、次のことを試してください。

$ awk '{print NF}' file2
4
4
4

awk ではNFフィールド数です。デフォルトでは、awk では単語文字はスペースで区切られます。

:file1の場合、単語はコロンまたはスペースで区切ることができるため、フィールド区切り文字に以下を追加する必要があります。

$ awk -F'[: \t]+' '{print NF}' file1
5
5
5

改善する

行に先行または末尾のスペースがある場合、awk は追加フィールドがあると想定します。 file1と同様に、フィールドを計算する前にこれらのスペースを削除することでこの問題を解決できます。

awk -F'[: \t]+' '{gsub(/^[: \t]+|[: \t]+$/, ""); print NF}' file1

またはfile2は次のようになります。

awk '{gsub(/^[[:space:]]+|[[:space:]]+$/, ""); print NF}' file2

正規表現では、前の^[[:space:]]+スペースと[[:space:]]+$末尾のスペースと一致します。コマンドでその組み合わせを使用すると、gsub両方が削除されます。

一般化する

フィールド区切り文字が - |: またはいずれかである場合は、以下を使用します。

awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}'

例:

$ cat file3
| [email protected] | er34532 |  
| [email protected] | 764474 |
$ awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}' file3
2
2

BASH：文書の各行の単語数を計算する

ベストアンサー1

改善する

一般化する

おすすめ記事