sed（またはawk）を使用して、特定のフィールドに同じ値を含む連続行を要約しますか？

Question

元の2番目の列を完全に無視すると、それを使用して連続行uniq -cで文字列が繰り返される回数を計算できます。

2つのフィールドの出力を使用すると、文字列が複数回繰り返されるたびに3番目のフィールドを作成できますuniq -c（テーブルからフィールドが発生した回数+xから1を引いた値）。x次に、最初の2つのフィールドを並べ替えて印刷します。

cut -d ' ' -f 1 file |
uniq -c |
awk '$1 > 1 { $3 = "+" $1 - 1 } { nr += $1; $1 = $2; $2 = nr - 1 - $3; print }'

このnr変数は、ソースファイルの行番号を表します。

質問のデータ出力を提供します。

1b41cf70 0
1cb8dd19 1
620f0b67 2 +1
f35d35fe 4
3a6fb62a 5
620f0b67 6 +2
b958a7ea 9
f35d35fe 10 +1
620f0b67 12

Answer 1

元の2番目の列を完全に無視すると、それを使用して連続行uniq -cで文字列が繰り返される回数を計算できます。

2つのフィールドの出力を使用すると、文字列が複数回繰り返されるたびに3番目のフィールドを作成できますuniq -c（テーブルからフィールドが発生した回数+xから1を引いた値）。x次に、最初の2つのフィールドを並べ替えて印刷します。

cut -d ' ' -f 1 file |
uniq -c |
awk '$1 > 1 { $3 = "+" $1 - 1 } { nr += $1; $1 = $2; $2 = nr - 1 - $3; print }'

このnr変数は、ソースファイルの行番号を表します。

質問のデータ出力を提供します。

1b41cf70 0
1cb8dd19 1
620f0b67 2 +1
f35d35fe 4
3a6fb62a 5
620f0b67 6 +2
b958a7ea 9
f35d35fe 10 +1
620f0b67 12

おすすめ記事