awk：NULをレコード区切り文字として使用しないフィールドの正確な文字列一致

Question

sedコマンドは、\n改行（）をNUL（\0）に変更せずにNUL +改行（\0\n）に変更します（cat -A図を参照）。

GNU awkを使用してRSをに設定すると、\0後続のレコード（および最初のフィールド）の最初の文字が加算され、正確な\n一致が中断されます。

改行's/\(,"[^,"]*\)\x00/\1/'分割修正はこれをまったく変更しません。 newline",c以前のレコードにレコードを追加するだけです。

高速で汚れた「解決策」は、単にセットではなくRS設定することです。しかし、awkが解析できるようにcsvファイルを処理するこの方法は信頼できないため、実際にはより良いものを見つける必要があります。\0\n\0

最後の例を使用して：

sed -e 's/$/\x00/' -e 's/\(,"[^,"]*\)\x00/\1/' input.txt |
gawk 'BEGIN {RS=ORS="\x00\n" ; FS=OFS=","} { if ($1=="a") print}' | cat -A
a,b,c^@$
a,"with quotes",c^@$
a,"with ,",c^@$
a,"with$
 newline",c^@$

sed -e 's/$/\x00/' -e 's/\(,"[^,"]*\)\x00/\1/' input.txt |
gawk 'BEGIN {RS="\x00\n" ; FS=OFS=","} { if ($1=="a") print}'
a,b,c
a,"with quotes",c
a,"with ,",c
a,"with
 newline",c

Answer 1

sedコマンドは、\n改行（）をNUL（\0）に変更せずにNUL +改行（\0\n）に変更します（cat -A図を参照）。

GNU awkを使用してRSをに設定すると、\0後続のレコード（および最初のフィールド）の最初の文字が加算され、正確な\n一致が中断されます。

改行's/\(,"[^,"]*\)\x00/\1/'分割修正はこれをまったく変更しません。 newline",c以前のレコードにレコードを追加するだけです。

高速で汚れた「解決策」は、単にセットではなくRS設定することです。しかし、awkが解析できるようにcsvファイルを処理するこの方法は信頼できないため、実際にはより良いものを見つける必要があります。\0\n\0

最後の例を使用して：

sed -e 's/$/\x00/' -e 's/\(,"[^,"]*\)\x00/\1/' input.txt |
gawk 'BEGIN {RS=ORS="\x00\n" ; FS=OFS=","} { if ($1=="a") print}' | cat -A
a,b,c^@$
a,"with quotes",c^@$
a,"with ,",c^@$
a,"with$
 newline",c^@$

sed -e 's/$/\x00/' -e 's/\(,"[^,"]*\)\x00/\1/' input.txt |
gawk 'BEGIN {RS="\x00\n" ; FS=OFS=","} { if ($1=="a") print}'
a,b,c
a,"with quotes",c
a,"with ,",c
a,"with
 newline",c

awk：NULをレコード区切り文字として使用しないフィールドの正確な文字列一致

ベストアンサー1

おすすめ記事