curl wget - HTMLタグとヘッダーを無視する方法

curl wget - HTMLタグとヘッダーを無視する方法

ブラウザに見えるWebページの内容だけどのように取得できますか…タイトルやHTMLタグは必要ありません。http://www.linfo.org/cat.html..コンテンツだけが欲しい..助けてください

ベストアンサー1

ページを印刷可能な形式にダンプするには、テキストブラウザ(たとえば、lynx、w3m、elinks)を使用できます。これらのブラウザには「-dump」オプションがあります。

ページの先頭です「リンスダンプ」:

   [1]LINFO

                               The cat Command

   cat is one of the most frequently used [2]commands on [3]Unix-like
   [4]operating systems. It has three related functions with regard to
   text files: displaying them, combining copies of them and creating new
   ones.

   cat's general syntax is

     cat [options] [filenames] [-] [filenames]

   The square brackets indicate that the enclosed items are optional.

おすすめ記事