すべてのファイルでURLアドレスを選択して出力する方法は? [コピー]

すべてのファイルでURLアドレスを選択して出力する方法は? [コピー]

どのコマンドが実行されるのか知りたいです。

  1. ファイルのすべてのURLを選択します(たとえば、最初から最後までhttpまたはwwwで始まるすべてのアドレスを識別し、それをテキストまたは他のデータから切り離します)。

  2. .txt ファイルに出力します。

次のアイデアは、.txtファイルでwget -iを実行することです。 wgetは元のファイルのすべてのURLを直接認識するのが難しいので、これらのURLを選択して.txtファイルから正しく出力する必要があります。

ベストアンサー1

私は以下の指示に従いました。grepを使用してスクリプトを挿入してHTMLファイルからWebサイトのURLを取得する方法私の場合、URLは入力ファイルの<href>の間にあったのでうまくいきました。

grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt

おすすめ記事