タブで区切られたいくつかのファイルのマージ

Question

次のスクリプトは、パラメータとして渡されたすべてのタブで区切られたファイルの列1（フィールド）に対して外部結合を実行する必要があります。それを使う参加するソートされたファイルに対して一度に2つのファイルを外部結合するコマンドです。

ヘッダー行を含むファイル内のすべての行を連結します。ヘッダーを除外するには、これら2つのsortコマンドをヘッダーを省略するソートファイルを生成するコマンドに変更します。

#!/bin/sh
if test $# -lt 2
then
    echo usage: gjoin file1 file2 ...
    exit 1
fi
sort -t $'\t' -k 1 "$1" > result
shift
for f in "$@"
do
    sort -t $'\t' -k 1 "$f" > temp
    join -1 1 -2 1 -t $'\t' result temp > newresult
    mv newresult result
done
cat result
rm result temp

古いシェルを使用している場合、$'\t'タブは置き換えられないため、を使用する必要があり、引用符の間に 'TAB'リテラルタブを配置する必要があります。

/bin/sh代わりに、次のような最新のシェル（bashやkshなど）が利用可能な場合は最適化できます。

sort -t $'\t' -k 1 "$f" > temp
join -1 1 -2 1 -t $'\t' result temp > newresult

に取り替えることができる

join -1 1 -2 1 -t $'\t' result <(sort -t $'\t' -k 1 "$f") > newresult

Answer 1

次のスクリプトは、パラメータとして渡されたすべてのタブで区切られたファイルの列1（フィールド）に対して外部結合を実行する必要があります。それを使う参加するソートされたファイルに対して一度に2つのファイルを外部結合するコマンドです。

ヘッダー行を含むファイル内のすべての行を連結します。ヘッダーを除外するには、これら2つのsortコマンドをヘッダーを省略するソートファイルを生成するコマンドに変更します。

#!/bin/sh
if test $# -lt 2
then
    echo usage: gjoin file1 file2 ...
    exit 1
fi
sort -t $'\t' -k 1 "$1" > result
shift
for f in "$@"
do
    sort -t $'\t' -k 1 "$f" > temp
    join -1 1 -2 1 -t $'\t' result temp > newresult
    mv newresult result
done
cat result
rm result temp

古いシェルを使用している場合、$'\t'タブは置き換えられないため、を使用する必要があり、引用符の間に 'TAB'リテラルタブを配置する必要があります。

/bin/sh代わりに、次のような最新のシェル（bashやkshなど）が利用可能な場合は最適化できます。

sort -t $'\t' -k 1 "$f" > temp
join -1 1 -2 1 -t $'\t' result temp > newresult

に取り替えることができる

join -1 1 -2 1 -t $'\t' result <(sort -t $'\t' -k 1 "$f") > newresult

タブで区切られたいくつかのファイルのマージ

ベストアンサー1

おすすめ記事