HTML ファイルのアンカー タグ内から URL を抽出したいのですが、これは SED/AWK を使用して BASH で行う必要があります。Perl は使用しないでください。
これを行う最も簡単な方法は何ですか?
ベストアンサー1
次のようなこともできます (lynx がインストールされている場合)...
Lynx バージョン < 2.8.8
lynx -dump -listonly my.html
Lynx バージョン >= 2.8.8 (@condit 提供)
lynx -dump -hiddenlinks=listonly my.html