PHPでwgetまたはCURLを使用してURLにアスタリスク*を含むWebページスナップショットを取得する方法は? (Wayback Machine archive.orgの問題)

PHPでwgetまたはCURLを使用してURLにアスタリスク*を含むWebページスナップショットを取得する方法は? (Wayback Machine archive.orgの問題)

Wayback Machine(archive.org)の次のページには、URLにアスタリスク*があります。 https://web.archive.org/web/*/https://www.nasa.gov/

CURLまたはwgetの両方がページを掻き取ることを許可しません。私は最新バージョンのLinux Mint(2018)を使用しています。

PHPでwgetまたはCURLを使用してURLにアスタリスク*を持つWebページのスナップショットを取得する方法、具体的にhttps://web.archive.org/web/*/https://www.nasa.gov/

ありがとうございます! httrackは動作しますか?

編集:ウェブサイトweb.archive.org/web/%2A/を開きます。https://www.nasa.govブラウザから。次に、wgetコマンドを使用して見たものと比較します。彼らは同じですか?私にとって、wgetコマンドは通常のページを返します。

ベストアンサー1

URLを引用符で囲むと大丈夫そうです。

「警告:ワイルドカード文字はHTTPではサポートされていません」というメッセージを避けるための最も簡単な方法は、アスタリスクをアスタリスクに置き換えることです。パーセントエンコードされた等価物:

wget "https://web.archive.org/web/%2A/https://www.nasa.gov"

おすすめ記事