正確な区切り記号の数を含む行だけを維持してください。

正確な区切り記号の数を含む行だけを維持してください。

カンマ区切りの10個のフィールドを持つ巨大なcsvファイルがあります。残念ながら、一部の行の形式が正しくないため、正確に10個のカンマが含まれていません(これにより、ファイルをRに読み込もうとするといくつかの問題が発生します)。正確に10個のカンマを含む行をフィルタリングする方法は?

ベストアンサー1

別のPOSIX:

awk -F , 'NF == 11' <file

行にカンマが10個ある場合、行には11個のフィールドがあります。だから私たちは単にフィールドセパレータとしてawk使用します。,フィールド数が11個で条件がNF == 11trueの場合、awk基本操作が実行されますprint $0

おすすめ記事