2つのファイルを比較して、一致しないレコードの行番号と一致しない各レコードの列番号をTEST2.txtに印刷します。

Question

苦手ですが効果的です：

BEGIN {
    FS=OFS="\t"
}

NR==FNR {
# 5 = number of columns
    for (i=0;i<=5;i++) {
        a[$1,i]=$i }
    }

{ if ( a[$1,0] != $0 ) {
    b=""
    for (i=1;i<=5;i++) {
        if ( a[$1,i] != $i ) {
            b=b i", "
            }
        }
    print "Line No." FNR," Column No. ",b
    }
}

ただし、これを行うには（たとえば）FORTRANプログラムを作成することをお勧めします。たとえば、10,000行などの大量のデータを読み取ることができ、awkこのソリューションを使用するにはRAMに1つ以上のファイルを保存する必要があります。これはGBサイズに問題がある可能性があります。ファイル。次のように見えます。

各ファイルのデータチャンクを配列（行と列）として読み込みます。
配列を比較し、a(i,j)=b(i,j) の結果を使用して論理配列を作成します。
出力を生成するために論理配列を使用します。
出力を印刷し、次のブロックを読みます。

ファイルがソートされ、すべての行が含まれているので、非常に簡単です。

Answer 1

苦手ですが効果的です：

BEGIN {
    FS=OFS="\t"
}

NR==FNR {
# 5 = number of columns
    for (i=0;i<=5;i++) {
        a[$1,i]=$i }
    }

{ if ( a[$1,0] != $0 ) {
    b=""
    for (i=1;i<=5;i++) {
        if ( a[$1,i] != $i ) {
            b=b i", "
            }
        }
    print "Line No." FNR," Column No. ",b
    }
}

ただし、これを行うには（たとえば）FORTRANプログラムを作成することをお勧めします。たとえば、10,000行などの大量のデータを読み取ることができ、awkこのソリューションを使用するにはRAMに1つ以上のファイルを保存する必要があります。これはGBサイズに問題がある可能性があります。ファイル。次のように見えます。

各ファイルのデータチャンクを配列（行と列）として読み込みます。
配列を比較し、a(i,j)=b(i,j) の結果を使用して論理配列を作成します。
出力を生成するために論理配列を使用します。
出力を印刷し、次のブロックを読みます。

ファイルがソートされ、すべての行が含まれているので、非常に簡単です。

2つのファイルを比較して、一致しないレコードの行番号と一致しない各レコードの列番号をTEST2.txtに印刷します。

ベストアンサー1

おすすめ記事