HTML ベースのドキュメントのディレクトリに移動し、テキストまたは PDF に変換します。

HTML ベースのドキュメントのディレクトリに移動し、テキストまたは PDF に変換します。

標準システムパッケージのドキュメントは以下に含まれています。

 /usr/share/doc/rsyslog-5.8.10 (distros: RHEL 6/Centos 6)

しかし、それはすべて*.htmlです。すべてのファイルを正しい順序で調べて、単一のPDFファイルまたは単一のTXTファイルを作成して、ページごとに手動で読み取る必要なく文書を印刷してオフラインで読み取ることができるようにしたいと思います。

どうすればいいですか?

ベストアンサー1

(find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec w3m -dump {} \; ) > /path/to/mydocs.txt

ファイルが一覧表示される順序がfind組織のデフォルト設定に合う場合は、それを使用してw3m(コンソールHTTPクライアント)HTMLをレンダリングし、それらをすべて単一のファイルに集約できます。

順序が気に入らない場合は、引数をバイパスしてファイルの-execリストを取得し、結果とソートされたリストを噛む前に並べ替えることができますw3m

おすすめ記事