Ebay HTMLページからいくつかの情報を抽出するBashスクリプト

Question

eBayからデータを取得する最良の方法は、eBayを利用することです。アプリケーションプログラミングインターフェース。つまり、時にはHTMLだけ持っている場合もあるので、これについては答えで扱います。

HTMLから情報を抽出するためにsedやgrepなどのツールを使用しないでください。完全に機能し、壊れやすい場合は、実行するのは非常に困難です。この道は狂気でいっぱいです。。

HTMLを解析する必要がある場合は、PythonなどのHTMLを解析するツールを使用してください。美しいスープライブラリ、パールHTML::ツリービルダー、ルビーのこぎり、等。

#!/usr/bin/env python2
import codecs, sys, BeautifulSoup
html = BeautifulSoup.BeautifulSoup(codecs.open(sys.argv[1], "r", "utf-8").read())
for lv in html.findAll("h3", "lvtitle"):
    url = lv.find("a")["href"]
    bid = lv.findNextSibling("ul").find("span", "bidsold").text.strip()
    print(url, bid)

Answer 1

eBayからデータを取得する最良の方法は、eBayを利用することです。アプリケーションプログラミングインターフェース。つまり、時にはHTMLだけ持っている場合もあるので、これについては答えで扱います。

HTMLから情報を抽出するためにsedやgrepなどのツールを使用しないでください。完全に機能し、壊れやすい場合は、実行するのは非常に困難です。この道は狂気でいっぱいです。。

HTMLを解析する必要がある場合は、PythonなどのHTMLを解析するツールを使用してください。美しいスープライブラリ、パールHTML::ツリービルダー、ルビーのこぎり、等。

#!/usr/bin/env python2
import codecs, sys, BeautifulSoup
html = BeautifulSoup.BeautifulSoup(codecs.open(sys.argv[1], "r", "utf-8").read())
for lv in html.findAll("h3", "lvtitle"):
    url = lv.find("a")["href"]
    bid = lv.findNextSibling("ul").find("span", "bidsold").text.strip()
    print(url, bid)

Ebay HTMLページからいくつかの情報を抽出するBashスクリプト

ベストアンサー1

おすすめ記事