awk変数に置き換える

Question

これはsedを使用して簡単に実行できます。

$ sed -E -e 's/^((.*)_USD.*)/\2 \1/' input.txt 
P2_142 P2_142_USD16089440L_HJM27DSXX_L3
P2_144 P2_144_USD16089441L_HJM27DSXX_L3
P2_145 P2_145_USD16089442L_HJM27DSXX_L3
P2_168 P2_168_USD16089450L_HJM27DSXX_L3
P2_171 P2_171_USD16089451L_HJM27DSXX_L4
P2_172 P2_172_USD16089452L_HJM27DSXX_L4
P2_188 P2_188_USD16089456L_HJM27DSXX_L4
P2_262 P2_262_USD16089477L_HJJNWDSXX_L2
P2_270 P2_270_USD16089479L_HJJNWDSXX_L2
P2_271 P2_271_USD16089480L_HJJNWDSXX_L4

sedスクリプトは、2つのキャプチャグループ、(つまりおよびで囲まれた正規表現パターンを使用します)。 1つ目はフル入力ライン、2つ目は前のラインの最初の部分です_USD。各入力行を2番目のキャプチャグループ（\2）、スペースに置き換えてから、1番目のキャプチャグループ（）に置き換えます\1。

または以下を使用してawk：

awk -F'_' -e '{print $1 "_" $2 " " $0}' input.txt

入力フィールド区切り文字をに設定し、_（各入力行に対して）下線とスペースを使用して最初の2つのフィールドを印刷し、入力行全体を印刷します。

コマンドにはいくつかの問題があります。

cat samples_long.10ids.txt | \
  awk -v sample="$1" '{gsub(/_USD.*/,"",sample); print $sample,$1}'

ファイルをawkにパイプするためにcatは必要ありません。 awkは、コマンドラインから引数として指定されたファイル名を読み取ることができます。
awk変数をsample"$1"に設定しています。私はいくつかの（表示されていない）シェルスクリプトラッパーの最初のパラメータではなく、awkの最初のフィールドを意味すると思います。それは動作しません。$1awkはシェルには存在しません。 awkが入力データ行を読み取るときにのみ存在します。
フィールド区切り文字として何を使用すべきかをawkに伝えていないので、デフォルトは空白（スペースとタブ）です。入力例には空白文字がないため、$ 1は入力行全体（$ 1と呼ばれます$0）です。
「$sample」を印刷中です。これは、変数に含まれるフィールド番号を印刷したいことをawkに伝えますsample。

sample 文字列を含むため、その0コンテキストではprint $sample-equivalentとして評価されますprinting $0。したがって、コードは有効ですprint $0 $1。これはうまくいきますprint $0 $0。行全体を2回印刷します。
sample（計算結果のフィールド番号ではありませんsample）コンテンツ自体を印刷するにはprint sample。
4番と5番のエントリには、より多くの説明が必要な場合、または少なくとも理解しやすい例が必要な場合があります。

NFawkが入力ラインを読み取るたびに、ラインのフィールド数という変数を自動的に設定します。

フィールド数を印刷するには、を印刷するだけですNF。フィールド番号がNFなどのフィールドを印刷するには、印刷します$NF（これにより、入力行の最後のフィールドが印刷されます）。

NF（整数）に対して算術およびその他の演算を実行することもできます。たとえば、print $(NF-1)最後から2番目のフィールドが印刷されます。

コードに戻り、$sample整数コンテキストにはsample値があるため、完全な入力行を0印刷しました。$0
上記のすべてを考慮すると、次のように動作します。
```
awk '{sample=$1; gsub(/_USD.*/,"",sample); print sample,$1}' samples_long.10ids.txt
```
しかし、このような単純な作業を行うには複雑すぎます。 awkは入力を下線で区切られたフィールドに分割できるため、これを行う方が簡単です。
```
awk -F'_' -e '{print $1 "_" $2 " " $0}' samples_long.10ids.txt
```

Answer 1