ファイル内の「a」から「z」までの列のすべての文字をどのように計算し、.tsv
各文字がどのくらいの頻度で表示されるかを出力で知ることができますか?
たとえば、これが列であるとします。
abc
abd
aabf
私が望む出力は次のとおりです。
4 a
3 b
1 c
1 d
1 f
ベストアンサー1
そしてgrep
、sort
そしてuniq
:
$ grep -o '[a-z]' file | sort | uniq -c
4 a
3 b
1 c
1 d
1 f
以下を使用して先行スペースを削除できますsed
。
$ grep -o '[a-z]' file | sort | uniq -c | sed 's/^ *//'
4 a
3 b
1 c
1 d
1 f
cut
7番目の列のみが必要な場合は、前に次を追加してください。
cut -f7 file | grep -o '[a-z]' | sort | uniq -c | sed 's/^ *//'