最初の単語に特定の文字セットを含む行を見つける

Question

単一の正規表現と一致させることはできません（*）。最終的な真または偽の結果を得るには、各条件（R 1、E 2、G 1、X 1）を個別に論理的にANDして一緒にテストする必要があります。

たとえば、次のようにしますawk。

$ awk '$1 ~ /R/ && $1 ~ /E.*E/ && $1 ~ /G/ && $1 ~ /X/' inputfile.txt 
NGNAEAREAX EAHVSELYCI FNWGNLACQM AWKLRMDHIT PRYMFNYMVM

(*) 次の代替項目を使用して正規表現を作成できます。すべて5文字（R、E、G、E、X）の可能な組み合わせは異なる順序で表示されますが、これは非現実的です。

しかし、大文字と小文字を区別しない一致が必要で、GNU awkを使用している場合：

$ awk -v IGNORECASE=1 '$1 ~ /R/ && $1 ~ /E.*E/ && $1 ~ /G/ && $1 ~ /X/' inputfile.txt

または、GNU awkなしで大文字と小文字を区別しません。

$ awk '$1 ~ /[Rr]/ && $1 ~ /[Ee].*[Ee]/ && $1 ~ /[Gg]/ && $1 ~ /[Xx]/' inputfile.txt

Answer 1

単一の正規表現と一致させることはできません（*）。最終的な真または偽の結果を得るには、各条件（R 1、E 2、G 1、X 1）を個別に論理的にANDして一緒にテストする必要があります。

たとえば、次のようにしますawk。

$ awk '$1 ~ /R/ && $1 ~ /E.*E/ && $1 ~ /G/ && $1 ~ /X/' inputfile.txt 
NGNAEAREAX EAHVSELYCI FNWGNLACQM AWKLRMDHIT PRYMFNYMVM

(*) 次の代替項目を使用して正規表現を作成できます。すべて5文字（R、E、G、E、X）の可能な組み合わせは異なる順序で表示されますが、これは非現実的です。

しかし、大文字と小文字を区別しない一致が必要で、GNU awkを使用している場合：

$ awk -v IGNORECASE=1 '$1 ~ /R/ && $1 ~ /E.*E/ && $1 ~ /G/ && $1 ~ /X/' inputfile.txt

または、GNU awkなしで大文字と小文字を区別しません。

$ awk '$1 ~ /[Rr]/ && $1 ~ /[Ee].*[Ee]/ && $1 ~ /[Gg]/ && $1 ~ /[Xx]/' inputfile.txt

おすすめ記事