自動生成されたHTTPインデックスを解析するツール？

Question

私はあなたがHTTPレスポンスに含まれているHTMLを解析したいと思います。
PHPに精通している場合は、カールを使用してページを検索し、PHPを使用して文字列をDOM構造に解析できます。DOMドキュメントクラス、DOMDocumentインスタンスを照会して、興味のあるinnerHTMLを取得できます。
コマンドラインPHPスクリプトで

#!/usr/bin/php

// curl or readfile or whatever for url and assign HTML body into variable $html
$html = '<!DOCTYPE html>
<html>
<head>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width">
    <title></title>
    link
</head>
<body>
    <h1>stuff in directory listing</h1>
</body>
</html>
';

$DOM = @DOMDocument::loadHTML($html);

$element = $DOM->getElementsByTagName("h1")->item(0);
echo $element->nodeValue;

とにかく、その理由は

これは、Webサーバーが提供するさまざまな応答に適応できる柔軟な実装を提供します。
正規表現でコンテンツを解析するのは非常に難しいでしょう。

ここに一つあります。デモ-http://codepad.viper-7.com/apsiKR

Answer 1

私はあなたがHTTPレスポンスに含まれているHTMLを解析したいと思います。
PHPに精通している場合は、カールを使用してページを検索し、PHPを使用して文字列をDOM構造に解析できます。DOMドキュメントクラス、DOMDocumentインスタンスを照会して、興味のあるinnerHTMLを取得できます。
コマンドラインPHPスクリプトで

#!/usr/bin/php

// curl or readfile or whatever for url and assign HTML body into variable $html
$html = '<!DOCTYPE html>
<html>
<head>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width">
    <title></title>
    link
</head>
<body>
    <h1>stuff in directory listing</h1>
</body>
</html>
';

$DOM = @DOMDocument::loadHTML($html);

$element = $DOM->getElementsByTagName("h1")->item(0);
echo $element->nodeValue;

とにかく、その理由は

これは、Webサーバーが提供するさまざまな応答に適応できる柔軟な実装を提供します。
正規表現でコンテンツを解析するのは非常に難しいでしょう。

ここに一つあります。デモ-http://codepad.viper-7.com/apsiKR

自動生成されたHTTPインデックスを解析するツール？

ベストアンサー1

おすすめ記事