HTTPファイルとディレクトリをリストするPython 質問する

HTTPファイルとディレクトリをリストするPython 質問する

IP アドレスしか持っていない場合、ファイルとフォルダーを一覧表示するにはどうすればよいでしょうか?

urllib などでは、index.htmlファイルの内容しか表示できません。しかし、ルートにあるファイルも確認したい場合はどうすればよいでしょうか?

必要に応じてユーザー名とパスワードを実装する方法を示す例を探しています。(ほとんどの場合、index.html は公開されていますが、他のファイルは公開されていない場合があります)。

ベストアンサー1

requestsページのコンテンツを取得し、BeautifulSoup結果を解析するために使用します。
たとえば、次isoの場所にあるすべてのファイルを検索する場合http://cdimage.debian.org/debian-cd/8.2.0-live/i386/iso-hybrid/:

from bs4 import BeautifulSoup
import requests

url = 'http://cdimage.debian.org/debian-cd/8.2.0-live/i386/iso-hybrid/'
ext = 'iso'

def listFD(url, ext=''):
    page = requests.get(url).text
    print page
    soup = BeautifulSoup(page, 'html.parser')
    return [url + '/' + node.get('href') for node in soup.find_all('a') if node.get('href').endswith(ext)]

for file in listFD(url, ext):
    print file

おすすめ記事