wgetを使ってフレームソースを取得する方法は?

wgetを使ってフレームソースを取得する方法は?

servicenow WebサイトからHTMLデータを取得しようとしています。私はフレームを使用していますが、wgetを使用してフレームソースを抽出したいと思います。これを行うオプション/フラグが見つかりません。フレームソースではなくページソースのみを抽出できます。

wget -q https://company.service-now.com/task.do?sysparm_query=number=TASK0299719

Chromeでウェブサイトの一部を右クリックします。

ベストアンサー1

フレームは、通常のリンクと同様に、独自のURLを持つ別々のページです。フレームを使用して最初のページ作成者は、ユーザーがページをクリックして自分で表示するのを待たずに、2番目のページをすぐに検索して最初のページ内に表示する必要があることを示します。

wgetには何も表示されず、インタラクティブなユーザーもないので、フレームとリンクの区別は意味がありません。したがって、この質問は「私はwgetがリンクをたどりたい」という特別なケースと考えることができます。

-rwgetには、元のURLのリンクに沿ってダウンロードする再帰モード()があります。ダウンロードしたくないかもしれませんみんなリンクURLが多すぎて範囲を減らす必要があります。

これが1回限りの操作である場合、またはフレームのURLが安定している場合は、元のページソースを直接読み、iframe要素のsrc属性を見つけて、wgetにその属性を取得するように要求します。

wgetがより多くの操作を実行できるようにするには、この--follow-tagsオプションを使用してiframe URLのみを取得するように要求できます。

wget -r --follow-tags=iframe http://yourpage/

これにより、ページとページに含まれるすべてのiframeがダウンロードされます。 iframe内にiframeがある場合は、再帰深度制限(たとえば)を指定しない限り、そのiframeも取得されます-l 1

おすすめ記事