2列マージ

2列マージ

2つの列を1つにマージしようとしています。私のデータセットは次のとおりです。

RSID1 RSID2
rs7475652 rs7475652
rs7475652 rs7918643
rs7475652 rs3125034
rs7475652 rs3750730
rs7475652 rs883728
rs7475652 rs4881500
rs7475652 rs3853288
rs7475652 rs4881504
rs7475652 rs2242271
rs7475652 rs7099607
rs7475652 rs10904597
rs7475652 rs3207775

ご覧のように、いくつかの重複した値があります。まず、列2を列1とマージしてから、コマンドを使用してuniq重複項目を削除する予定です。これら2つの列をマージしてから、重複した列を削除したいと思います。

以下は、この例で予想される出力の最初の部分です。

rs7475652
rs7475652
rs7475652
rs7918643
rs7475652
rs3125034
rs7475652
rs3750730
rs7475652
rs883728 

ベストアンサー1

この質問を推測するとは、目的の出力が次のようになることを意味します。

RSID1
RSID2
rs7475652
rs7475652
rs7475652
rs7918643
rs7475652
rs3125034
rs7475652
rs3750730
rs7475652
rs883728
rs7475652
rs4881500
rs7475652
rs3853288
rs7475652
rs4881504
rs7475652
rs2242271
rs7475652
rs7099607
rs7475652
rs10904597
rs7475652
rs3207775

それから

awk '{print $1 "\n" $2}'

そうするでしょう。 awk は、OP が実行しようとしている次のステップを処理して、出力を一意にすることもできます。これを実行するコードは、出力がペアごとに一意である必要があるか(各行が前の行とは異なる)か、グローバルに一意であるべきか(各行がすべての前の行と異なる)によって異なります。

おすすめ記事