ヘッダーに特定の部分文字列を含むcsvファイルから列を抽出するawkコマンド

Question

mlrこの偽のCSV形式は実際にサポートされており、正規表現に基づいてフィールドを切り取ることができます。

$ mlr --csv --csv-trim-leading-space --allow-ragged-csv-input cut -rf a2 your-file.csv
"aaa2, aa214",aa21,aa211
data,data,data

ただし、これはメモリに収まらないCSVには拡張されません。--allow-ragged-csv-input例と行ごとのフィールド数が異なるCSVを処理するには、いずれの場合でもファイル全体を読み取って列数を把握する必要があります（ヘッダーのない列には数値ヘッダーが自動的に割り当てられます）。

Answer 1

mlrこの偽のCSV形式は実際にサポートされており、正規表現に基づいてフィールドを切り取ることができます。

$ mlr --csv --csv-trim-leading-space --allow-ragged-csv-input cut -rf a2 your-file.csv
"aaa2, aa214",aa21,aa211
data,data,data

ただし、これはメモリに収まらないCSVには拡張されません。--allow-ragged-csv-input例と行ごとのフィールド数が異なるCSVを処理するには、いずれの場合でもファイル全体を読み取って列数を把握する必要があります（ヘッダーのない列には数値ヘッダーが自動的に割り当てられます）。

おすすめ記事