Webサーバーインデックスからのみディレクトリ/ファイル名リストをダウンロードする

Question

HTTPプロトコルには、HTTPサーバーから「ファイルリスト」を要求する機能はありません。

curl//wgetブラウザはランダムなリクエスト文字列を含むURLを要求し、サーバーはランダムなデータを返します。

ただし、次のように名前を抽出できます。

curl --silent http://prodata.swmed.edu/download/ | grep -o 'href=".*">' | sed 's/href="//;s/\/">//'  

bin
dev
etc
member
pub
usr
usr1
usr2

Answer 1

HTTPプロトコルには、HTTPサーバーから「ファイルリスト」を要求する機能はありません。

curl//wgetブラウザはランダムなリクエスト文字列を含むURLを要求し、サーバーはランダムなデータを返します。

ただし、次のように名前を抽出できます。

curl --silent http://prodata.swmed.edu/download/ | grep -o 'href=".*">' | sed 's/href="//;s/\/">//'  

bin
dev
etc
member
pub
usr
usr1
usr2

おすすめ記事