与えられたパターンと一致しないすべての行を特定する方法

Question

実際、引用符を含むフィールドがないとします。

awk -F, 'NF == 7' file
awk -F, 'NF != 7' file   # show the "bad lines"

これにより、カンマで区切られた7つのフィールドを含むすべての行が印刷されます。

これが適切なCSVファイル（参照フィールドにフィールド区切り文字を含めることができる）の場合は、CSVパーサーが必要です。私はRubyを使って次のように表現するのが好きです。

ruby -rcsv -pe 'next unless CSV.parse_line($_).length == 7' test.csv
ruby -rcsv -pe 'next if CSV.parse_line($_).length == 7' test.csv  # show the "bad"

正規表現できるエレガントなソリューションを提供しますが、私の考えではここにはありません。

grep -E '^([^,]+,){6}[^,]+$' test.csv
grep -vE '^([^,]+,){6}[^,]+$' test.csv   # show the "bad" lines

Answer 1

実際、引用符を含むフィールドがないとします。

awk -F, 'NF == 7' file
awk -F, 'NF != 7' file   # show the "bad lines"

これにより、カンマで区切られた7つのフィールドを含むすべての行が印刷されます。

これが適切なCSVファイル（参照フィールドにフィールド区切り文字を含めることができる）の場合は、CSVパーサーが必要です。私はRubyを使って次のように表現するのが好きです。

ruby -rcsv -pe 'next unless CSV.parse_line($_).length == 7' test.csv
ruby -rcsv -pe 'next if CSV.parse_line($_).length == 7' test.csv  # show the "bad"

正規表現できるエレガントなソリューションを提供しますが、私の考えではここにはありません。

grep -E '^([^,]+,){6}[^,]+$' test.csv
grep -vE '^([^,]+,){6}[^,]+$' test.csv   # show the "bad" lines

与えられたパターンと一致しないすべての行を特定する方法

ベストアンサー1

おすすめ記事