ファイル1のすべてのオブジェクトIDのfastaシーケンスをコピーできるように、ファイルの最初の列のすべての値をファイル2の行テキストと一致させる方法を教えてください。
ファイル1.csvファイル
Object_ID, Length, Assignment
NODE_142_length_92872_cov_11.2497,92872,2005469
NODE_405_length_50717_cov_10.7964,50717,82654
NODE_775_length_33402_cov_18.9306,33402,1147
NODE_1008_length_27630_cov_17.7829,27630,1184
ファイル2 fasta.file
>NODE_1_length_501653_cov_19.284
TGGTGTGAGAGGCGCACCTCGCTAACTTTTCAGTTAGCGAGGCCGTCTACTCGATTAGCT
GTTATGAGCCCGACGAGCTACCAACTGCTCCATCCCGCGATATTGTGATGCAAAGGTAAG
>NODE_142_length_92872_cov_11.2497
ATTAACTACTAAGTTACAAATTTTAGTAGCTGTCCAGTTTAAAGGAAGTATTTCATATTT
TCGCTTACGTTAAATAGGAAAAGCAAGTTCTTTTTTGAGGTACCCAGTGAGTCTGATTTT
結果ファイル
>NODE_142_length_92872_cov_11.2497
ATTAACTACTAAGTTACAAATTTTAGTAGCTGTCCAGTTTAAAGGAAGTATTTCATATTT
TCGCTTACGTTAAATAGGAAAAGCAAGTTCTTTTTTGAGGTACCCAGTGAGTCTGATTTT
ありがとう
ベストアンサー1
これは次の方法で行うことができます。
for i in `awk -F ',' '{print $1}' file1.csv `; do grep $i fasta.file ; done
ここでは、まず次のようにObject_ID
file1.csv から抽出します。
awk -F ',' '{print $1}' file1.csv
その後、その周りにループを実行して別のファイルから抽出します。