ユーザーのツイートを含むテキストファイルがあります。
470192 anneJackson Apple's new iPhone is a no go for me
470193 trex90 For something so expensive, I'll go for Android anyway
470194 anneJackson What an outrageous pricing!
最初の列はIDを表し、次にユーザー名とユーザーのツイートが表示されます。今やりたいことは、一意のユーザーあたりのツイート数を数えるコマンドを書くことです。これにより、次のような結果が得られます。
anneJackson 2
trex 1
私は同様のことを試しました:
cut -f 2 Twitter_Data_1 | sort | uniq -c
しかし、ユーザー列だけを使用してツイートを含めないため、正しくない感じがします。
ベストアンサー1
いいことだアッ:
awk '{ a[$2]++ }END{ for(i in a) printf "%-15s%s\n",i,a[i] }' Twitter_Data_1
a[$2]++
- 各固有の発生回数を増やします。ユーザー名(2番目のフィールド値として表示$2
)
出力:
trex90 1
anneJackson 2