列の最初の5つの要素を残りの要素と比較する

Question

通常、行（行）で作業するのが最善です。awk一度に1行ずつ作業するのと同じツールです。列を行に変換（転置など）するには、次のようにします。牛に似た一種の栄養datamash。その後、各行をawk個別にテストして、適切に印刷または印刷しないことがあります。最後に、datamash再度使用して結果を元の形式に置き換えます。

<data datamash transpose | awk '{
    for (i=2; i<=5; i++) if ($1!=$i) next
    for (i=6; i<=NF; i++) if ($1==$i) next
    print
}' | datamash transpose

論理的な説明は次のとおりです。

2..5のフィールドがフィールド番号1と異なる場合、最初のフィールドは行をスキップして再開forします。 5つのフィールドがすべて同じでなければ、プログラムは次のコード行を実行し続けることができます。
for次のフィールドのうち最初のフィールドと同じフィールドがある場合、2番目のフィールドは行をスキップして最初から再開します。
プログラムがこれら2つのfor基準を超えた場合、あなたの基準と矛盾する条件がまったく見つからなかったことを意味します。これでのみライン全体を印刷できます。

メモ:

元の質問（転置する必要はありません）では、少なくとも1つの列が基準と矛盾しない場合にのみ、次の行を読んでください。データによっては、最初の数行を読み取った後、すべての列が不一致として宣言されることがあります。この場合、アルゴリズムはすぐに終了し、何も印刷しない可能性があります。ただし、datamash transposeデータに関係なく、ファイル全体（またはストリーム）を読み取って処理する必要があります。この場合、私の解決策は理想的ではありません。
うまくいかない場合は解決策がdatamashありますawkここ。

Answer 1

通常、行（行）で作業するのが最善です。awk一度に1行ずつ作業するのと同じツールです。列を行に変換（転置など）するには、次のようにします。牛に似た一種の栄養datamash。その後、各行をawk個別にテストして、適切に印刷または印刷しないことがあります。最後に、datamash再度使用して結果を元の形式に置き換えます。

<data datamash transpose | awk '{
    for (i=2; i<=5; i++) if ($1!=$i) next
    for (i=6; i<=NF; i++) if ($1==$i) next
    print
}' | datamash transpose

論理的な説明は次のとおりです。

2..5のフィールドがフィールド番号1と異なる場合、最初のフィールドは行をスキップして再開forします。 5つのフィールドがすべて同じでなければ、プログラムは次のコード行を実行し続けることができます。
for次のフィールドのうち最初のフィールドと同じフィールドがある場合、2番目のフィールドは行をスキップして最初から再開します。
プログラムがこれら2つのfor基準を超えた場合、あなたの基準と矛盾する条件がまったく見つからなかったことを意味します。これでのみライン全体を印刷できます。

メモ:

元の質問（転置する必要はありません）では、少なくとも1つの列が基準と矛盾しない場合にのみ、次の行を読んでください。データによっては、最初の数行を読み取った後、すべての列が不一致として宣言されることがあります。この場合、アルゴリズムはすぐに終了し、何も印刷しない可能性があります。ただし、datamash transposeデータに関係なく、ファイル全体（またはストリーム）を読み取って処理する必要があります。この場合、私の解決策は理想的ではありません。
うまくいかない場合は解決策がdatamashありますawkここ。

列の最初の5つの要素を残りの要素と比較する

ベストアンサー1

おすすめ記事