次のファイルがあります。
hello there. let's try&ACCT=1&bla bla bla&EX=1118&anything ss &SERIAL=1011&DEAL=NO
BLA BLA BLA&TOM=1&ACCT=2&LSLSLSLSL&none=1&EX=1218&lord=1&ok=1&SERIAL=201&flag=non
出力を次のようにACCT=
抽出する必要があるフィールド値は次のとおりです。EX=
SERIAL=
1,11/18,1011
2,12/18,201
ここで、aを中間文字としてEX
挿入したい4桁の数字は常にです。/
ベストアンサー1
test.inというファイルに入れたサンプル入力に基づいて、次のawkコマンドを実行すると、目的の出力が得られます。
awk -F\& '{for (i=1; i<+NF; i++) {if ($i ~ /^ACCT=/) {acct=$i; sub(/^ACCT=/, "", acct)} if ($i ~ /^EX=/) {ex=$i; sub(/^EX=/, "", ex); sub(/^[0-9][0-9]/, "&/", ex)} if ($i ~ /^SERIAL=/) {serial=$i; sub(/^SERIAL=/, "", serial)}} printf("%s,%s,%s\n", acct, ex, serial)}' test.in
それがすることは、&をフィールド区切り文字として扱うことです。次に、ACCT =、EX =、またはSERIAL =で始まることを確認して、指定された行の各フィールドを処理します。フィールドが見つかると、そのフィールドが適切な変数に割り当てられます。次に、サブコマンドを使用して変数の先頭を削除します。これはそのキーに関連する値を提供します。
EXキーの最初の2桁の後にスラッシュ(/)を追加する必要があるため、これはEXの別のサブキーです。アンパサンド(&)は逆参照であり、最初の2桁の数字を取得するために使用されます。
すべてのフィールドが処理された後、行で見つかった値を印刷します。