awkを使用して一致するデータを選択して抽出する方法は？

Question

あなたの遺伝子名のリストはDOSテキストファイルですね。これは、各遺伝子名の末尾に追加のキャリッジリターンがあることを意味します。これは、ファイル間で名前が一致しないことを意味します。これは出力が空であることを意味します。

.dllを使用して遺伝子リストをUnixテキストファイルに変換しますdos2unix。その後、コードを使用してくださいムルさんがコメントを残しました。（2番目のファイルがタブで区切られていると仮定）：

awk -v OFS='\t' 'FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

または、awk各行の末尾からキャリッジリターンを削除します。

awk -v OFS='\t' '{ sub("\r$", "") } FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

Answer 1

あなたの遺伝子名のリストはDOSテキストファイルですね。これは、各遺伝子名の末尾に追加のキャリッジリターンがあることを意味します。これは、ファイル間で名前が一致しないことを意味します。これは出力が空であることを意味します。

.dllを使用して遺伝子リストをUnixテキストファイルに変換しますdos2unix。その後、コードを使用してくださいムルさんがコメントを残しました。（2番目のファイルがタブで区切られていると仮定）：

awk -v OFS='\t' 'FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

または、awk各行の末尾からキャリッジリターンを削除します。

awk -v OFS='\t' '{ sub("\r$", "") } FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

おすすめ記事