Pythonを使用してHTMLをプレーンテキストにレンダリングする質問する

Question

BeautifulSoupはスクレイピングライブラリなので、HTMLレンダリングにはおそらく最適な選択肢ではありません。BeautifulSoupを使用する必要がない場合は、html2text。例えば：

import html2text
html = open("foobar.html").read()
print html2text.html2text(html)

出力は次のようになります:

いくつかのテキスト、より多くのテキスト、さらにより多くのテキスト

  * リスト項目
  * さらに別のリスト項目

その他のテキスト

  * リスト項目
  * さらに別のリスト項目

Answer 1

BeautifulSoupはスクレイピングライブラリなので、HTMLレンダリングにはおそらく最適な選択肢ではありません。BeautifulSoupを使用する必要がない場合は、html2text。例えば：

import html2text
html = open("foobar.html").read()
print html2text.html2text(html)

出力は次のようになります:

いくつかのテキスト、より多くのテキスト、さらにより多くのテキスト

  * リスト項目
  * さらに別のリスト項目

その他のテキスト

  * リスト項目
  * さらに別のリスト項目

おすすめ記事