他のファイルでの変数発生回数の計算

Question

\tsは実際にはタブ文字であり、同じ列にあり、AはAAではなくAにのみ一致すると仮定します。aA、B、C を含むファイルと一致bするかどうかを計算するファイル (提供された 2 番目のファイル) を想定します。

まず、可能な一致のみを取得し、b残りはすべて無視する必要があります。これは、ファイルの一部を切り取るためにb使用できる3番目の列です。cut

カット -f 3b
その後、それを発生回数と発生回数のリストに変換する必要があります。uniq出力をソートして計算するために使用できます。cut

ソート|ユニクロ-c
最後に、あなたはこれのためにみんなinbですが、の値のみが必要ですa。joinこれを使用して、共通フィールド（この場合、最初と唯一のフィールド（デフォルトではaこれを行うように見えます）と2番目のファイル（2）でbある2番目のフィールド（-2））から2つの異なるファイルをリンクできます。

接続-2 2a 結果-b

いくつかの異なる方法で接続することができ、1つの可能な方法は、bashプロセス交換で名前付きパイプを使用することです。

join -2 2 a <(cut -f 3 b | sort | uniq -c)

これは、bを3回だけ処理し（他の列と削除sort）、uniq結合が入力をソートする必要があるため、各ファイルを一度だけ読み取るため、grep単独よりも少なくとも優れています。もちろん、これは私が作成した仮定に依存します（そしてソートも必要ですaが、これは以前のソートされていない場合を<(sort a)置き換えるだけです）。a

Answer 1

\tsは実際にはタブ文字であり、同じ列にあり、AはAAではなくAにのみ一致すると仮定します。aA、B、C を含むファイルと一致bするかどうかを計算するファイル (提供された 2 番目のファイル) を想定します。

まず、可能な一致のみを取得し、b残りはすべて無視する必要があります。これは、ファイルの一部を切り取るためにb使用できる3番目の列です。cut

カット -f 3b
その後、それを発生回数と発生回数のリストに変換する必要があります。uniq出力をソートして計算するために使用できます。cut

ソート|ユニクロ-c
最後に、あなたはこれのためにみんなinbですが、の値のみが必要ですa。joinこれを使用して、共通フィールド（この場合、最初と唯一のフィールド（デフォルトではaこれを行うように見えます）と2番目のファイル（2）でbある2番目のフィールド（-2））から2つの異なるファイルをリンクできます。

接続-2 2a 結果-b

いくつかの異なる方法で接続することができ、1つの可能な方法は、bashプロセス交換で名前付きパイプを使用することです。

join -2 2 a <(cut -f 3 b | sort | uniq -c)

これは、bを3回だけ処理し（他の列と削除sort）、uniq結合が入力をソートする必要があるため、各ファイルを一度だけ読み取るため、grep単独よりも少なくとも優れています。もちろん、これは私が作成した仮定に依存します（そしてソートも必要ですaが、これは以前のソートされていない場合を<(sort a)置き換えるだけです）。a

他のファイルでの変数発生回数の計算

ベストアンサー1

おすすめ記事