2つの一致文字列のうちの1つが一致する場合、行を抽出する方法は？

Question

ここでは、次のことができます。

cut -d _ -f 2 < country.txt

または、入力に_文字のない行を含めることができる場合：

awk -F _ 'NF >= 2 {print $2}' < country.txt

国名に文字を含めることができ、その行の最初の出現の間または後の部分を_返す場合は、次のようにします。__raw_clean

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

またはGNUを使用してくださいgrep：

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

-P（PCREサポートで構築されている場合grep）正規表現はPerl互換正規表現です。これらの正規表現では、\K一致する文字列の先頭がリセットされ、プレビュー(?=...)演算子です。つまり、...一致する部分に含まれる残りの文字列で一致するものを探します。出力を一致する部分にします-o。したがって、ここでは上記と一致するものを印刷します。つまり、貪欲ではない同等物です。つまり、できるだけ短いゼロ個以上の文字シーケンス（この場合、ゼロ個以上の下線シーケンスの後に続く）です。（）は（）行を開始し、その後ろにアンダースコアが続き、後ろに続くか続くと見なされます。grep.*?.*[^_]*^_raw_clean

これを使用して、pcregrep次のように書くこともできます。

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

それを使用すると、-o1最初の部分と一致する部分が印刷されます(...)。

Answer 1

テキストを処理するためにシェルループを使用しない。