結合を使用した複数ファイルのマージ

Question

デフォルトでは3つのファイルの例と同じです。

$ join file2 file3| join file1 -
1 test1 example1 foo1
2 test3 example2 foo2
3 test4 example3 foo3
4 test5 example4 foo4

しかし重要なことすべての入力ファイルはすでにソートされている必要があります（sort -k 1b,1例のような数値ソートは機能しない可能性があります！）。したがって、上記の動的ソートの例はbash次のように書くことができます。

join <(sort -k 1b,1 file2) <(sort -k 1b,1 file3) | join <(sort -k 1b,1 file1) -\
  | sort -k 1n,1

最後に、再帰関数を使用するn個のファイルの一般的なケースです（でテスト済みbash）。

xjoin() {
    local f
    local srt="sort -k 1b,1"

    if [ "$#" -lt 2 ]; then
            echo "xjoin: need at least 2 files" >&2
            return 1
    elif [ "$#" -lt 3 ]; then
            join <($srt "$1") <($srt "$2")
    else
            f=$1
            shift
            join <($srt "$f") <(xjoin "$@")
    fi
}

xjoin file1 file2 file3 | sort -k 1n,1

実行している作業がわかっている場合は、ソートパイプラインを省略できます。しかし、私の経験上、joinこれについて明確ではないと、sort問題が発生することがよくあります。

Answer 1

デフォルトでは3つのファイルの例と同じです。

$ join file2 file3| join file1 -
1 test1 example1 foo1
2 test3 example2 foo2
3 test4 example3 foo3
4 test5 example4 foo4

しかし重要なことすべての入力ファイルはすでにソートされている必要があります（sort -k 1b,1例のような数値ソートは機能しない可能性があります！）。したがって、上記の動的ソートの例はbash次のように書くことができます。

join <(sort -k 1b,1 file2) <(sort -k 1b,1 file3) | join <(sort -k 1b,1 file1) -\
  | sort -k 1n,1

最後に、再帰関数を使用するn個のファイルの一般的なケースです（でテスト済みbash）。

xjoin() {
    local f
    local srt="sort -k 1b,1"

    if [ "$#" -lt 2 ]; then
            echo "xjoin: need at least 2 files" >&2
            return 1
    elif [ "$#" -lt 3 ]; then
            join <($srt "$1") <($srt "$2")
    else
            f=$1
            shift
            join <($srt "$f") <(xjoin "$@")
    fi
}

xjoin file1 file2 file3 | sort -k 1n,1

実行している作業がわかっている場合は、ソートパイプラインを省略できます。しかし、私の経験上、joinこれについて明確ではないと、sort問題が発生することがよくあります。

結合を使用した複数ファイルのマージ

ベストアンサー1

おすすめ記事