awkを使用して、複数の文字区切り文字でフィールドを区切ります。

Question

awkあなたが直面する問題は、（GNU）マンページ[1]の次の説明に関連しているようです。

FSが単一文字の場合、フィールドはその文字で区切られます。 FSが空の文字列の場合、個々の文字は別々のフィールドになります。それ以外の場合、FSは完全な正規表現でなければなりません。。

フィールド区切りパターンには正規表現で特別な意味を持つ文字（the|とthe ^）が含まれているため、その文字を正しくエスケープする必要があります。awk変数がどのように解釈されるか（文字列リテラル解析）二重）、次のように指定する必要があります。二重バックスラッシュ、良い

awk -F '\\|~\\^' '{print $2}' input.txt

あなたの例の結果出力は次のとおりです。

20200425
abc
abc
abc
abc
abc
abc
20200425

T次から始まる行のみを考慮するには

awk -F '\\|~\\^' '/^T/ {print $2}' input.txt

または、特定のフィールド（ここでは最初のフィールド）の値が次のような行を選択するだけですT。

awk -F '\\|~\\^' '$1=="T" {print $2}' input.txt

どちらの場合も、例の結果

20200425

一般的に、およびを使用する必要はほとんどawkありませんgrep。sedまた、これらのツールはすべてファイルに直接アクセスできるため、cat処理するためにテキストを提供する必要はありません。

[1]：（関連していない）注：「空の文字列」を含む部分は、すべてのAwkバリアントでは機能しません。 GNU Awk マニュアルには次の内容が記載されています。「これは一般的な拡張です。POSIX標準ではこれを指定しません。」

Answer 1