wgetが幅優先または深さ優先に従う場合

wgetが幅優先または深さ優先に従う場合

wgetを実行するときは、深さ優先のように「リンクをたどる」を望みます。リンクに出会うと、次のようになります。しかし、どういうわけか最初のページを最初に処理し、すべてのリンクを取得してからそのリンクを実行するようです。インポートする各ページには新しい/入れ子になったリンクがありますが、元のページを完了するまでそのリンクには到達しません。これが本当にうまくいくかどうか尋ねたかったので、私がやっていることがうまくいくかどうかを知り、開始ページへのリンクが完了するまでページを取得できないかどうかを知りたかったです。

ベストアンサー1

~から手動:

hrefWget は HTTP URL を使用して、指定された URL から HTML または CSS を検索および解析し、src等タグで指定された CSS URI 値を介して、または '' 関数表記を使用して、ドキュメントが参照するファイルを検索します。新しくダウンロードしたファイルが、またはタイプurl()の場合、さらに解析され追跡されます。text/htmlapplication/xhtml+xmltext/css

HTTPおよびHTML / CSSコンテンツの再帰検索は、幅優先。つまり、Wgetは最初に要求された文書をダウンロードしてから、その文書からリンクされた文書、リンクされた文書などをダウンロードします。つまり、Wgetは最初に深さ1の文書をダウンロードし、次に深さ2の文書をダウンロードするように指定された最大深度までダウンロードします。

おすすめ記事