修正されたテキストのAWK

修正されたテキストのAWK

次のファイルがあります。

hello there. let's try&ACCT=1&bla bla bla&EX=1118&anything ss &SERIAL=1011&DEAL=NO
BLA BLA BLA&TOM=1&ACCT=2&LSLSLSLSL&none=1&EX=1218&lord=1&ok=1&SERIAL=201&flag=non

出力を次のようにACCT=抽出する必要があるフィールド値は次のとおりです。EX=SERIAL=

1,11/18,1011
2,12/18,201

ここで、aを中間文字としてEX挿入したい4桁の数字は常にです。/

ベストアンサー1

test.inというファイルに入れたサンプル入力に基づいて、次のawkコマンドを実行すると、目的の出力が得られます。

awk -F\& '{for (i=1; i<+NF; i++) {if ($i ~ /^ACCT=/) {acct=$i; sub(/^ACCT=/, "", acct)} if ($i ~ /^EX=/) {ex=$i; sub(/^EX=/, "", ex); sub(/^[0-9][0-9]/, "&/", ex)} if ($i ~ /^SERIAL=/) {serial=$i; sub(/^SERIAL=/, "", serial)}} printf("%s,%s,%s\n", acct, ex, serial)}' test.in

それがすることは、&をフィールド区切り文字として扱うことです。次に、ACCT =、EX =、またはSERIAL =で始まることを確認して、指定された行の各フィールドを処理します。フィールドが見つかると、そのフィールドが適切な変数に割り当てられます。次に、サブコマンドを使用して変数の先頭を削除します。これはそのキーに関連する値を提供します。

EXキーの最初の2桁の後にスラッシュ(/)を追加する必要があるため、これはEXの別のサブキーです。アンパサンド(&)は逆参照であり、最初の2桁の数字を取得するために使用されます。

すべてのフィールドが処理された後、行で見つかった値を印刷します。

おすすめ記事