sedを使用してXMLファイルから特定のテキストを取得する

Question

「正規表現がXMLを解析するのに十分ではないため、適切なXMLパーサーを使用する必要があります」という必須の説明を取り上げて、行にはsed2つの問題があります。

迅速で汚いHTMLスクレイピングシェルスクリプトのために、次の2つのことをお勧めします。

したがって、これはコマンドを次のようにします。

grep -o 'state="[^"]*"'

または本当に〜しなければならないsedを使用してください：

sed -n 's/.*\(state="[^"]*"\).*/\1/p'

Answer 1

「正規表現がXMLを解析するのに十分ではないため、適切なXMLパーサーを使用する必要があります」という必須の説明を取り上げて、行にはsed2つの問題があります。

迅速で汚いHTMLスクレイピングシェルスクリプトのために、次の2つのことをお勧めします。

したがって、これはコマンドを次のようにします。

grep -o 'state="[^"]*"'

または本当に〜しなければならないsedを使用してください：

sed -n 's/.*\(state="[^"]*"\).*/\1/p'

おすすめ記事