百万行のファイルがあります。各行transactionid
には、重複した値を持つ名前のフィールドがあります。私がしなければならないことは、それらを明確に数えることだけです。値が何度も繰り返されても、一度だけ計算する必要があります。
ベストアンサー1
さて、ファイルがカンマ区切り文字「、」で区切られたフィールドを持つテキストファイルであるとしましょう。どのフィールドが'transactionid'
どこにあるかがわかります。あなたの'transactionid'
フィールドが7番目のフィールドであるとしましょう。
awk -F ',' '{print $7}' text_file | sort | uniq -c
これにより、7番目のフィールドで固有/固有の発生回数が計算され、結果が印刷されます。