ソートを使用して列を選択し、カンマ区切り文字 ',' を使用して csv を切り取り、カンマ "text,text" を含む引用符内のデータを無視します。

Question

CSVは構造化文書形式です。したがって、単純なテキスト操作ツールcut（データが単純でない場合、または）は、CSVファイルを安全かつ便利に処理するのに十分ではありません（フィールドに区切り文字と改行を含めることができますsort）sed。awk代わりに、CSVをサポートする処理ツールを使用することをお勧めします。ミラー（mlr）。

次のMillerコマンドは、ファイルをヘッダーなしのCSVファイルに解析し、12番目のフィールドに基づいて数値を昇順に並べ替えます。

mlr --csv -N sort -n 12 file

CSVデータにヘッダーがある場合は、その-Nオプションを削除して代わりにヘッダー名を使用してください12。

mlr --cvs sort -n pvalue file

列 12 を抽出するには、

mlr --csv -N cut -f 12 file

種類そして何が起こっても、私たちは最初の10の結果だけを得ます。

mlr --csv -N sort -n 12 then cut -f 12 then head -n 10 file

-N繰り返しますが、入力にヘッダーがある場合はそれを削除し、代わりにフィールド名を使用してください。

とともにcsvkitcsvsort次の結果を得るために使用できるツールキット：

csvsort -H -c 12 file | tail -n +2

（このtailコマンドは生成されたヘッダーを削除しますcsvsort）または入力のヘッダーを使用して

csvsort -c pvalue file

個々のフィールドを抽出するには、次のコマンドを使用しますcsvcut。

csvcut -H -c 12 file

結合するcsvsort：

csvsort -H -c 12 file | csvcut -c 12 | head -n +2

またはタイトルを使用して、

csvsort -c pvalue file | csvcut -c pvalue

コマンドがないため、csvhead結果は他の方法で10レコードに制限する必要がありますmlr --csv head -n 10。

Answer 1