awk：最初の列に基づいてソートし、2番目の列のみを出力し、2番目の列をすべて出力します。

Question

元のawkソリューションが削除されました - aより良いソリューション公開済み

実際に入力を事前にソートしてから、awkを使用してフォーマットすることができます。

sort twocol | awk 'BEGIN{OFS="\t"} {print $1 == last ? "" : $1, $2; last = $1}'
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

これにより、タブ区切りの出力が生成されます。スペースが必要な場合は結果をパイプしますexpand。

または、匿名配列のPerlハッシュを使用して2番目の列値を集計し、ソートして印刷することもできます。

perl -alne '
  push @{ $h{$F[0]} }, $F[1] 
  }{ 
  foreach $k (sort {$a <=> $b} keys %h) {
    @a = sort {$a <=> $b} @{ $h{$k} };
    print join "\n", map { ($_ == 0 ? $k : "") . "\t" . $a[$_] } 0..$#a;
  }
  ' twocol
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

{$a <=> $b}ゼロパディングされたデータを事前にソートすることは、数字でソートするのと同じであるため、これらの操作は不要です。

ただ楽しく、ミラー:

mlr -S --nidx --ofs tab put -q '
  @m[$1] = is_not_array(@m[$1]) ? [$2] : append(@m[$1],$2); 
  end { 
    @m = sort(apply(@m, func(k,v) { return {k: joinv(sort(v), "\n\t")}; }));
    emit @m, ""
  }
  ' twocol 
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

Answer 1