HTMLからデータを抽出する簡単な方法

HTMLからデータを抽出する簡単な方法

Webページを検索するとき

curl -X POST http://example.com/data/123

私は次のような答えを受けました。

<td><a href="http://help.example.com " target="_blank">help.example.com</a></td>
<td><a href="http://hello.example.com " target="_blank">hello.example.com</a></td>
<td><a href="http://test.example.com " target="_blank">test.example.com</a></td>

上記の応答で、タグなしですべてのサブドメインを1つずつインポートしたいと思います。たとえば、次のようになります。

help.example.com
hello.example.com
test.example.com

ベストアンサー1

あなたはそれを使用することができますsed

$ cat test

<td><a href="http://help.domain.com " target="_blank">help.domain.com</a></td>
<td><a href="http://hello.domain.com " target="_blank">hello.domain.com</a></td>
<td><a href="http://test.domain.com " target="_blank">test.domain.com</a></td>

$ sed 's/^.*">//;s/<.*//' test

help.domain.com
hello.domain.com
test.domain.com

おすすめ記事