コマンドラインでPDFファイルを人間が読める形式でレンダリングし、レイアウト全体を維持する一般的な方法はありますか?

コマンドラインでPDFファイルを人間が読める形式でレンダリングし、レイアウト全体を維持する一般的な方法はありますか?

私はこれより深いことを想像しています。PDFをテキストとして(部分ポプラツール)、仮想ページのレイアウトのほとんどを保存することが可能だと思います。たとえば、ポケットベルを介してパイプされます。最大、単純なグラフなどのシンボルベースの置換を取得することも可能です。

一般的に使用されるコマンドチェーンやスクリプトは非常に興味深いでしょう。

あまりにも多くのコメントが必要な質問を避けるために、質問に「共通」という言葉を追加しました。

ここで重要な優先順位は、ソリューションが完全に移植可能であり、たとえば、Macのシングルユーザーモードでも使用できるかどうかです。

ベストアンサー1

pdftotext実際にオプションがあります-layout

   -layout
          Maintain  (as  best  as  possible) the original physical
          layout of the text.  The default is to  ´undo'  physical
          layout  (columns, hyphenation, etc.) and output the text
          in reading order.

しかしグラフィックはしません。

おすすめ記事