2つのファイルの各レコード間のn個の列値を比較し、ファイル2のデータをファイル1に追加します。

Question

これは一般的な作業ですawk。考えられる解決策は次のとおりです。

awk '
NR==FNR {
    match($0,/.*\$/)
    pref = substr($0,RSTART,RLENGTH)
    rest = substr($0,RSTART+RLENGTH)
    suff = substr(rest, index(rest,"|"))
    suffixes[pref] = suff
    next
}
{
    match($0,/.*\$/)
    prefix = substr($0,RSTART,RLENGTH)
    match($0,/.*\$[0-9]+|/)
    data = substr($0,RSTART,RLENGTH)
    if (prefix in suffixes)
        print data suffixes[prefix]
}
' file2 file1

file1あなたの質問には「input file」というファイルはどこにあり、あなたの質問にはfile2「another file」というファイルはどこにありますか？（リスト内のファイルの順序を参照してください。）

説明する：

最初のコマンドブロックは、最初のファイルを読み取ると実行されますfile2。これはNR==FNR、最初のファイルを読み取る場合にのみ真の条件によって達成されます。 2番目のコマンドブロックは2番目のファイルに対してのみ実行されます（最初のコマンドブロックのコマンドfile1のため）。next最初のブロックはプレフィックスprefとサフィックスを抽出しsuff、suffixes[pref] = suff各プレフィックスに対応するサフィックスを記憶します。これは、2番目のブロックのデータを参照するために必要です。 2番目のブロックでは、同様のコマンドが実際に実行されてプレフィックスを抽出し、それを使用して保存されたサフィックスから正しいサフィックスを取得します。 1つの違いがあります。シンボルの後の数字も#新しいプレフィックスデータの一部として保持する必要があるため、配列matchにアクセスするために必要なプレフィックスsuffixesと結果データの一部になるために必要なプレフィックスを区別する2番目のタスクがあります。

Answer 1

これは一般的な作業ですawk。考えられる解決策は次のとおりです。

awk '
NR==FNR {
    match($0,/.*\$/)
    pref = substr($0,RSTART,RLENGTH)
    rest = substr($0,RSTART+RLENGTH)
    suff = substr(rest, index(rest,"|"))
    suffixes[pref] = suff
    next
}
{
    match($0,/.*\$/)
    prefix = substr($0,RSTART,RLENGTH)
    match($0,/.*\$[0-9]+|/)
    data = substr($0,RSTART,RLENGTH)
    if (prefix in suffixes)
        print data suffixes[prefix]
}
' file2 file1

file1あなたの質問には「input file」というファイルはどこにあり、あなたの質問にはfile2「another file」というファイルはどこにありますか？（リスト内のファイルの順序を参照してください。）

説明する：

最初のコマンドブロックは、最初のファイルを読み取ると実行されますfile2。これはNR==FNR、最初のファイルを読み取る場合にのみ真の条件によって達成されます。 2番目のコマンドブロックは2番目のファイルに対してのみ実行されます（最初のコマンドブロックのコマンドfile1のため）。next最初のブロックはプレフィックスprefとサフィックスを抽出しsuff、suffixes[pref] = suff各プレフィックスに対応するサフィックスを記憶します。これは、2番目のブロックのデータを参照するために必要です。 2番目のブロックでは、同様のコマンドが実際に実行されてプレフィックスを抽出し、それを使用して保存されたサフィックスから正しいサフィックスを取得します。 1つの違いがあります。シンボルの後の数字も#新しいプレフィックスデータの一部として保持する必要があるため、配列matchにアクセスするために必要なプレフィックスsuffixesと結果データの一部になるために必要なプレフィックスを区別する2番目のタスクがあります。

2つのファイルの各レコード間のn個の列値を比較し、ファイル2のデータをファイル1に追加します。

ベストアンサー1

おすすめ記事