AWKは最初の3つの値を探します。

Question

次のPerlスクリプトは、配列ハッシュ（またはHoA）と呼ばれるデータ構造を使用します。ハッシュ（％sites）には、最初の3つのフィールド（サイト、地域、都市）から派生したキーがあり、ハッシュの各要素は、その特定のキーのすべての合計を含む配列です。

HoA を作成するには、各行を読み取って先行または末尾のスペースを削除し、空行を無視します。また、コメント（文字で始まるすべて#）を無視します。なぜなら、実行しやすく、テキストデータファイルのデータに注釈を付けることができると便利です。

スクリプトは入力ファイル全体を読み取り、各キーに属する配列を逆順に並べ替え、各キーの最初の3つの値のみを含む要約行を印刷します。

#!/usr/bin/perl

my %sites=();

while(<>) {
  chomp;
  s/#.*//;        # strip comments #
  s/^\s*|\s*$//g; # strip leading and trailing spaces
  next if (/^$/); # skip blank lines

  my($site,$region,$town,$total) = split /,/;
  my $key = "$site,$region,$town";

  push @{ $sites{$key} }, $total;
}

foreach my $k (sort keys %sites) {
  @{ $sites{$k} } = reverse sort @{ $sites{$k} };
  print $k . ": " . join(", ",@{ $sites{$k}}[0..2] ), "\n";
};

出力例：

$ ./jon.pl input.txt
site1,North,Bristol: 996776, 9776, 6776
site2,South,Guildford: 99392, 392, 2392
site2,South,London: 99381, 381, 2381
site3,Central,Birmingham: 992628, 5628, 2628
site3,Wales,Cardiff: 99834, 9834, 834
site3,Wales,Swansea: 991796, 3796, 21796
site5,South,Guildford: 99338, 338, 2338
site5,South,London: 99266, 3266, 266
site5,South,Windsor: 99359, 359, 2359
site5,West,Bristol: 997700, 9700, 7700

input.txtあなたが提供し、何度もコピーしたサンプルデータと、コピーで編集された合計が含まれます。

出力はより細かく修正するか、各合計に対して1行を印刷するように簡単に変更できます（ヒント、Join（）の代わりに配列要素[0..2]を繰り返します）。

ところで、それははいでこのようなものを実装することは可能ですが、で行う方がはるかにawk簡単ですperl。

Answer 1