ファイルBのフィールド名を含むファイルAの列全体を削除します。

ファイルBのフィールド名を含むファイルAの列全体を削除します。

500列のファイルがあります。他のファイルのリストに名前が記載されているいくつかの列を削除する必要があります。例えば

fileA:

    id1 id22 id43 id4 id5 id6 id7 id68 id9 id10 id11 
    TT AA AG TC TT AA AG TC DD AA CC     
    TT AC GG TC TT AG AG TC AD AA DC 

fileB:

    id1
    id5
    id10
    id68

希望の出力:

         id22 id43 id4 id6 id7 id9 id11 
           AA AG TC AA AG DD CC     
           AC GG TC AG AG AD DC  

ベストアンサー1

これを一行と呼びたいかどうかはわかりませんが、非常に基本的なツールを使用してすぐに実行できます。

cut -d' ' -f $(head -n 1 fileA | tr -s ' ' '\n' | cat -n | grep -wvf fileB | cut -f 1 | tr '\n ' ',' | sed -e 's/,$//' -e 's/^,//') fileA

説明する:

このcutコマンドは、cut -d' ' -f [...] fileA単にスペースを区切り文字として使用し、-d' '保持するフィールドを選択します-f。次に、動的に生成されたカンマ区切りインデックスのリストに基づいて、どのフィールド/列を使用するかについて質問があります。

head -n 1 fileAヘッダー行のみを選択し、tr -s ' ' '\n'すべてのスペースを改行に変更し(-s複数のスペースを単一のスペースに圧縮して)、cat -nこのリストに行番号を追加します。

この行番号は元の列番号と同じであるため、残りの行番号を選択する必要があります。削除リストのヘッダーを反転してgrep -wvf fileB(同時に削除されないようにするために使用されます)、このリストが行番号のみを指すようにし、改行文字をコンマ()に変換してカンマ区切りリストを提供します。残りの列数です。ただし、最後のステップでは、リストの前後にコンマがあるため、を使用して削除する必要があります。これで外部フィールドのリストが完成しました。grep-wid1id11cut -f 1tr '\n' ','sed -e 's/,$//' -e 's/^,//'cut

まず、カウンターチェックで内部パイプラインを別々に実行することもできます。追加の列インデックスは結果に影響を与えません。

おすすめ記事