File1の列を一致させてFile2から対応するfastaシーケンスを取得する方法は？

2024-06-21 • tag-icon

File1の列を一致させてFile2から対応するfastaシーケンスを取得する方法は？

ファイル1のすべてのオブジェクトIDのfastaシーケンスをコピーできるように、ファイルの最初の列のすべての値をファイル2の行テキストと一致させる方法を教えてください。

ファイル1.csvファイル

Object_ID, Length, Assignment
NODE_142_length_92872_cov_11.2497,92872,2005469
NODE_405_length_50717_cov_10.7964,50717,82654
NODE_775_length_33402_cov_18.9306,33402,1147
NODE_1008_length_27630_cov_17.7829,27630,1184

ファイル2 fasta.file

>NODE_1_length_501653_cov_19.284
TGGTGTGAGAGGCGCACCTCGCTAACTTTTCAGTTAGCGAGGCCGTCTACTCGATTAGCT
GTTATGAGCCCGACGAGCTACCAACTGCTCCATCCCGCGATATTGTGATGCAAAGGTAAG
>NODE_142_length_92872_cov_11.2497
ATTAACTACTAAGTTACAAATTTTAGTAGCTGTCCAGTTTAAAGGAAGTATTTCATATTT
TCGCTTACGTTAAATAGGAAAAGCAAGTTCTTTTTTGAGGTACCCAGTGAGTCTGATTTT

結果ファイル

>NODE_142_length_92872_cov_11.2497
ATTAACTACTAAGTTACAAATTTTAGTAGCTGTCCAGTTTAAAGGAAGTATTTCATATTT
TCGCTTACGTTAAATAGGAAAAGCAAGTTCTTTTTTGAGGTACCCAGTGAGTCTGATTTT

ありがとう

ベストアンサー1

これは次の方法で行うことができます。

for i in `awk -F ',' '{print $1}' file1.csv `; do grep $i fasta.file ; done

ここでは、まず次のようにObject_IDfile1.csv から抽出します。 awk -F ',' '{print $1}' file1.csv

その後、その周りにループを実行して別のファイルから抽出します。

ベストアンサー1

おすすめ記事