改行なしのw3mウェブサイトのダンプ

改行なしのw3mウェブサイトのダンプ

私の母国語は英語ではありません。文法的エラーがある場合はご了承ください。

誰もが本は良い友達であり、無知を取り除くというオンライン図書館を持っていますが、英語が上手ではなく、本のテキストをダウンロードしてGoogle翻訳CLIを使って母国語に翻訳することにしました。

https://kpu.pressbooks.pub/political-ideologies/front-matter/introduction/

そのため、w3m cli Webブラウザをインストールし、w3m cli Webブラウザを使用して上記のWebサイトにアクセスしましたが、ここでは出力に改行文字がありません。 w3m

ただし、このWebサイトの出力をファイルに保存すると、改行が発生します。

コマンドは

  1. w3m>file.txtまたは
  2. w3m -dump <site>> file.txt 調査した結果、各行の列サイズが 80 程度であることが確認されました。端子列のサイズは80です。つまり、改行テキストは1つの連続した段落に変換されます。だから私に解決策を提案してください。

事前にありがとう

ベストアンサー1

からman w3m

   -cols num
          with  stdout  as  destination;  HTML is rendered to lines of num
          characters

おすすめ記事