特定のパターンが含まれている場合は、あるテキストファイルの行を別のテキストファイルにコピーしたいと思います。

特定のパターンが含まれている場合は、あるテキストファイルの行を別のテキストファイルにコピーしたいと思います。

RS番号(最初の列)と他のバリエーションを含む.txt文書があります。

rs2925757 A 0.113329
rs10929982 T 0.113329
rs2119812 C 0.182322
rs7629805 A 0.182322
rs6771792 C 0.19062
rs11709077 G 0.157004
rs13083375 G 0.14842
rs13064760 C 0.14842
rs7638903 G 0.14842
rs4684847 C 0.14842

次のような他のtxt文書があります(2列のRS番号)。

--- rs181860478 30004551 C A 0.000 0.000 1.000 0 -1 -1 -1
--- rs187641010:30004588:C:A 30004588 C A 0.000 0.001 1.000 0 -1 -1 -1
--- rs678486:30004607:A:G 30004607 A G 0.204 0.961 0.983 0 -1 -1 -1
--- rs145540866:30004629:C:A 30004629 C A 0.000 0.000 1.000 0 -1 -1 -1
--- 12:30004702:C:T 30004702 C T 0.000 0.001 1.000 0 -1 -1 -1
--- 12:30004732:A:G 30004732 A G 0.000 0.099 0.999 0 -1 -1 -1
--- exm-rs147708347 30004743 A C 0.001 0.965 1.000 0 -1 -1 -1

これは、rs番号が列に単独である場合もあり、その後に来る場合もあり:----------、rsで始まる場合もあることを意味しますexm-

txtファイル2からtxtファイル1にリストされているすべてのrs番号を抽出できるようにしたいです。これを行う方法についての提案はありますか?

ベストアンサー1

次のコマンドを使用できます。

grep -Fwe "$(awk '{print $1}' file1)" file2 >output.txt

これは file1 の最初の列を取得し、grepfile2 のパターン検索セットに提供します。

提供されたサンプルデータには一致するデータはありませんが、機能します。

おすすめ記事