Python の機械化、URL によるリンクの追跡、nr パラメータとは何ですか? 質問する

Question

br.follow_linkLinkオブジェクトまたはキーワード引数 (など) のいずれかを取りますnr=0。

br.links()すべてのリンクをリストします。

br.links(url_regex='...')正規表現に一致する URL を持つすべてのリンクを一覧表示します。

br.links(text_regex='...')リンクテキストが正規表現に一致するすべてのリンクを一覧表示します。

br.follow_link(nr=num)numページ上の番目のリンクをたどります。カウントは 0 から始まります。レスポンスオブジェクト (br.open(...) が返すものと同じ種類) を返します。

br.find_link(url='...')指定された URL と完全に一致するLinkオブジェクトを返します。url

br.find_link、、br.linksはすべて同じキーワードを受け入れます。を実行して、br.follow_linkそれらのキーワードに関するドキュメントを参照してください。br.click_linkhelp(br.find_link)

編集：フォローしたいターゲット URL がある場合は、次のようにします。

import mechanize
br = mechanize.Browser()
response=br.open("http://www.example.com/")
target_url='http://www.rfc-editor.org/rfc/rfc2606.txt'
for link in br.links():
    print(link)
    # Link(base_url='http://www.example.com/', url='http://www.rfc-editor.org/rfc/rfc2606.txt', text='RFC 2606', tag='a', attrs=[('href', 'http://www.rfc-editor.org/rfc/rfc2606.txt')])
    print(link.url)
    # http://www.rfc-editor.org/rfc/rfc2606.txt
    if link.url == target_url:
        print('match found')
        # match found            
        break

br.follow_link(link)   # link still holds the last value it had in the loop
print(br.geturl())
# http://www.rfc-editor.org/rfc/rfc2606.txt

Answer 1