私はcurl
HTMLページの操作にコマンドラインを使用するのが好きです。
相対URLは痛いです。
すべての相対URLを絶対URLにする単純なユーティリティはありますか?
理想的には
curlabsolute $URL | process
ベストアンサー1
あなたに必要なものwget
実用的な事項:
与えられた簡単なWebページをダウンロードする必要があるとしましょうhttp://www.littlewebhut.com/articles/simple_web_page/
。
コマンド(以下に使用URLtrueの場合、コマンドは「現状のまま」テストできます。)
wget -O simple_page -k http://www.littlewebhut.com/articles/simple_web_page/
-O
(--output-document=file
) - そのファイルに文書が記録されず、すべての文書がリンクされて記録されますfile
。-k
(--convert-links
) - ダウンロードが完了したら、文書のリンクをローカルビューに適したものに変換します。
上記のWebページのいくつかの状況に合ったHTMLスニペットを紹介します。今後ダウンロード(オンライン版):
...
<ul>
<li><a href="/" class="color-menu">Home</a></li>
<li><a href="/html/" class="color-menu">HTML</a></li>
<li><a href="/css/" class="color-menu">CSS</a></li>
<li><a href="/javascript/" class="color-menu">JavaScript/jQuery</a></li>
<li><a href="/inkscape/" class="color-menu">Inkscape</a></li>
<li><a href="/gimp/" class="color-menu">GIMP</a></li>
<li><a href="/blender/" class="color-menu">Blender</a></li>
<li><a href="/articles/" class="color-menu">Articles</a></li>
<li><a href="/contact/" class="color-menu">Contact</a></li>
</ul>
同じ作品後ろにダウンロードしてファイルに保存simple_page
:
...
<ul>
<li><a href="http://www.littlewebhut.com/" class="color-menu">Home</a></li>
<li><a href="http://www.littlewebhut.com/html/" class="color-menu">HTML</a></li>
<li><a href="http://www.littlewebhut.com/css/" class="color-menu">CSS</a></li>
<li><a href="http://www.littlewebhut.com/javascript/" class="color-menu">JavaScript/jQuery</a></li>
<li><a href="http://www.littlewebhut.com/inkscape/" class="color-menu">Inkscape</a></li>
<li><a href="http://www.littlewebhut.com/gimp/" class="color-menu">GIMP</a></li>
<li><a href="http://www.littlewebhut.com/blender/" class="color-menu">Blender</a></li>
<li><a href="http://www.littlewebhut.com/articles/" class="color-menu">Articles</a></li>
<li><a href="http://www.littlewebhut.com/contact/" class="color-menu">Contact</a></li>
</ul>