sed 文字列に無効な文字が含まれています

Question

これにより、正しい正規表現が生成されます。

a="$(printf '%s' {a..z} {A..Z} {0..9} - )"
b="_*+ßäöü()%@€&=."

regex="[^$b$a]"
replaceChar="_"

その後、次のように動作します。

line="testﬂŒÆ˘ˆı››◊‹ıÓÌˇˆÁÓˆﬂÌˆ™ˇÏˆıÍÓÌıÓWÌtest"
echo "$line" | sed -e "s/${regex}/${replaceChar}/g"

test_______________________________W_test

興味深いのは、LANG=Cコマンドが失敗した場合です。次の単純な正規表現を使用しても：

$ (LANG=C; echo "testﬂŒÆtest" | sed -e "s/[^tesæ]/_/g")
test_____�_test

シンボルが何であるかを確認するには：

$ (LANG=C; echo "testﬂŒÆtest" | sed -e "s/[^tesæ]/_/g")|od -An -tcx1
   t   e   s   t   _   _   _   _   _ 303   _   t   e   s   t  \n
  74  65  73  74  5f  5f  5f  5f  5f  c3  5f  74  65  73  74  0a

つまり、303です。長い文字列についても繰り返されます。たぶんそれがあなたが見ているものかもしれません。

Answer 1

これにより、正しい正規表現が生成されます。

a="$(printf '%s' {a..z} {A..Z} {0..9} - )"
b="_*+ßäöü()%@€&=."

regex="[^$b$a]"
replaceChar="_"

その後、次のように動作します。

line="testﬂŒÆ˘ˆı››◊‹ıÓÌˇˆÁÓˆﬂÌˆ™ˇÏˆıÍÓÌıÓWÌtest"
echo "$line" | sed -e "s/${regex}/${replaceChar}/g"

test_______________________________W_test

興味深いのは、LANG=Cコマンドが失敗した場合です。次の単純な正規表現を使用しても：

$ (LANG=C; echo "testﬂŒÆtest" | sed -e "s/[^tesæ]/_/g")
test_____�_test

シンボルが何であるかを確認するには：

$ (LANG=C; echo "testﬂŒÆtest" | sed -e "s/[^tesæ]/_/g")|od -An -tcx1
   t   e   s   t   _   _   _   _   _ 303   _   t   e   s   t  \n
  74  65  73  74  5f  5f  5f  5f  5f  c3  5f  74  65  73  74  0a

つまり、303です。長い文字列についても繰り返されます。たぶんそれがあなたが見ているものかもしれません。

sed 文字列に無効な文字が含まれています

ベストアンサー1

おすすめ記事