テキストファイルの固有要素数の計算

テキストファイルの固有要素数の計算

ユーザーのツイートを含むテキストファイルがあります。

470192   anneJackson    Apple's new iPhone is a no go for me
470193   trex90         For something so expensive, I'll go for Android anyway 
470194   anneJackson    What an outrageous pricing!

最初の列はIDを表し、次にユーザー名とユーザーのツイートが表示されます。今やりたいことは、一意のユーザーあたりのツイート数を数えるコマンドを書くことです。これにより、次のような結果が得られます。

anneJackson   2
trex          1

私は同様のことを試しました:

cut -f 2 Twitter_Data_1 | sort | uniq -c

しかし、ユーザー列だけを使用してツイートを含めないため、正しくない感じがします。

ベストアンサー1

いいことだアッ:

awk '{ a[$2]++ }END{ for(i in a) printf "%-15s%s\n",i,a[i] }' Twitter_Data_1
  • a[$2]++- 各固有の発生回数を増やします。ユーザー名(2番目のフィールド値として表示$2

出力:

trex90         1
anneJackson    2

おすすめ記事