入力ファイル:is2.txt
10.39.5.41,A1,B1
10.39.5.41,A2,B2
10.39.5.41,A3,B3
10.39.5.41,A4,B4
10.39.5.41,A5,B5
10.39.5.41,A6,B6
スクリプト:
#!/bin/bash
second_column="OOOOOOO" # OOOOOOO will be added to every second column
third_column="XXXXXXXX" # XXXXXXXX will be added to every third column
awk -v second="$second_column" -v third="$third_column" 'BEGIN { FS="," }
{
if(a[$1])
{a[$1]=a[$1]";second"$2";third"$3}
else
{a[$1]=a[$1]second$2";"third$3}}
END{for (i in a)print i";"a[i];}' < is2.txt
output:
[root@testgfs2 test]# ./testawk.awk
10.39.5.41;OOOOOOOA1;XXXXXXXXB1;secondA2;thirdB2;secondA3;thirdB3;secondA4;thirdB4;secondA5;thirdB5;secondA6;thirdB6
シェル変数(second_column、third_column)が出力全体に反映されず、最初の行にのみ反映されるのはなぜですか?何が問題なの?
予想出力:
10.39.5.41;OOOOOOOA1;XXXXXXXXB1;OOOOOOOA2;XXXXXXXXB2;OOOOOOOA3;XXXXXXXXB3;OOOOOOOA4;XXXXXXXXB4;OOOOOOOA5;XXXXXXXXB5;OOOOOOOA6;XXXXXXXXB6
また、これをn列(例えばn = 100)に一般化する方法はありますか?
ベストアンサー1
以下は、推奨間隔とインデントを含むawkコードです。問題を見ることができますか?
BEGIN { FS = "," }
{
if(a[$1])
a[$1] = a[$1] ";second" $2 ";third" $3
else
a[$1] = a[$1]second $2 ";" third$3
}
END {
for (i in a)
print i ";" a[i]
}
あなたはsecond
条項に引用しました。third
if
予想される出力を推測すると、次のようになります。
awk -v c2='OOOOOOO' -v c3='XXXXXXXX' -v FS=, -v OFS=';' -v ORS=';' '
!f {
printf "%s", $1
f=1
}
{
$1 = ""
$2 = c2 $2
$3 = c3 $3
}
1
' | sed 's/;;/;/g; s/;$//'
出力:
10.39.5.41;OOOOOOOA1;XXXXXXXXB1;OOOOOOOA2;XXXXXXXXB2;OOOOOOOA3;XXXXXXXXB3;OOOOOOOA4;XXXXXXXXB4;OOOOOOOA5;XXXXXXXXB5;OOOOOOOA6;XXXXXXXXB6
このアプローチを一般化するには、文字列の前に追加したいビットを渡し、それをawk配列に分割できます。次に、明示的な列変数の代わりにforループを使用します。
awk -v prepends='OOOOOOO XXXXXXXX' -v FS=, -v OFS=';' -v ORS=';' '
BEGIN { split(prepends, cn, / +/) }
!f {
printf "%s", $1
f=1
}
{
$1 = ""
for(i=1; i<=NF; i++)
$i = cn[i-1] $i
}
1' | sed 's/;;/;/g; s/;$//'