awk区切り記号で列を分割する

Question

あなたの質問では完全には明確ではありませんが（下記のコメントを参照）、「二重項目が最初の項目を取る場所」と仮定すると、各行FOO=barに重複項目があることを意味します。これはあなたが望むものかもしれないと思います。 do（すべてのUnixシステムのすべてのシェルでawkを使用）：

$ cat tst.awk
BEGIN { OFS=";" }
{
    delete f
    n = split($7,subFlds,/;/)
    for (i=1; i<=n; i++) {
        tag = val = subFlds[i]
        sub(/=.*/,"",tag)
        sub(/,.*/,"",val)
        if ( !(tag in f) ) {
            f[tag] = val
        }
    }
    print f["AF"], f["FSAF"], f["FSAR"]
}

$ awk -f tst.awk file
AF=0.730769;FSAF=12;FSAR=7
AF=0.6;FSAF=3;FSAR=3
AF=0.266667;FSAF=0;FSAR=4

もちろん、出力区切り記号の形式が要件OFSに合わない場合は、必要に応じて変更できます。

データにタグ=値のペアがある場合は、まず値マッピング（上記f[]）のタグ配列（別名）を作成し、必要に応じてタグごとに値を印刷/テスト/変更/すべての値を印刷/テスト/変更できます。お気に入りのものを注文してください。

上記の方法は、ラベルが入力で常に同じ順序で表示されない場合や、一部の行で一部のラベルが欠落している場合にも機能します。

Answer 1

あなたの質問では完全には明確ではありませんが（下記のコメントを参照）、「二重項目が最初の項目を取る場所」と仮定すると、各行FOO=barに重複項目があることを意味します。これはあなたが望むものかもしれないと思います。 do（すべてのUnixシステムのすべてのシェルでawkを使用）：

$ cat tst.awk
BEGIN { OFS=";" }
{
    delete f
    n = split($7,subFlds,/;/)
    for (i=1; i<=n; i++) {
        tag = val = subFlds[i]
        sub(/=.*/,"",tag)
        sub(/,.*/,"",val)
        if ( !(tag in f) ) {
            f[tag] = val
        }
    }
    print f["AF"], f["FSAF"], f["FSAR"]
}

$ awk -f tst.awk file
AF=0.730769;FSAF=12;FSAR=7
AF=0.6;FSAF=3;FSAR=3
AF=0.266667;FSAF=0;FSAR=4

もちろん、出力区切り記号の形式が要件OFSに合わない場合は、必要に応じて変更できます。

データにタグ=値のペアがある場合は、まず値マッピング（上記f[]）のタグ配列（別名）を作成し、必要に応じてタグごとに値を印刷/テスト/変更/すべての値を印刷/テスト/変更できます。お気に入りのものを注文してください。

上記の方法は、ラベルが入力で常に同じ順序で表示されない場合や、一部の行で一部のラベルが欠落している場合にも機能します。

awk区切り記号で列を分割する

ベストアンサー1

おすすめ記事