特定のタグを使用してHTMLファイルから複数行の文字列を抽出する

Question

というコマンドラインツールがあります。シデルXPathまたはCSSセレクタを使用して、目的の部分を抽出できます。

次のようなことはあなたが言うことをするでしょう：

./xidel test.html --extract '//span[@class="style530"]' --output-format bash

ただし、閉じられていない出力があるため、必要以上の出力が返されることに注意してください。<span class="style530">

Answer 1

というコマンドラインツールがあります。シデルXPathまたはCSSセレクタを使用して、目的の部分を抽出できます。

次のようなことはあなたが言うことをするでしょう：

./xidel test.html --extract '//span[@class="style530"]' --output-format bash

ただし、閉じられていない出力があるため、必要以上の出力が返されることに注意してください。<span class="style530">

おすすめ記事