カンマ区切りの10個のフィールドを持つ巨大なcsvファイルがあります。残念ながら、一部の行の形式が正しくないため、正確に10個のカンマが含まれていません(これにより、ファイルをRに読み込もうとするといくつかの問題が発生します)。正確に10個のカンマを含む行をフィルタリングする方法は?
ベストアンサー1
別のPOSIX:
awk -F , 'NF == 11' <file
行にカンマが10個ある場合、行には11個のフィールドがあります。だから私たちは単にフィールドセパレータとしてawk
使用します。,
フィールド数が11個で条件がNF == 11
trueの場合、awk
基本操作が実行されますprint $0
。