正確な区切り記号の数を含む行だけを維持してください。

2024-06-14 • tag-icon

csv filter

カンマ区切りの10個のフィールドを持つ巨大なcsvファイルがあります。残念ながら、一部の行の形式が正しくないため、正確に10個のカンマが含まれていません（これにより、ファイルをRに読み込もうとするといくつかの問題が発生します）。正確に10個のカンマを含む行をフィルタリングする方法は？

別のPOSIX：

awk -F , 'NF == 11' <file

行にカンマが10個ある場合、行には11個のフィールドがあります。だから私たちは単にフィールドセパレータとしてawk使用します。,フィールド数が11個で条件がNF == 11trueの場合、awk基本操作が実行されますprint $0。

おすすめ記事