後でテキストを処理するためにPDFリーダーが読み取ったテキストを文字列として保存できるツールを作成することは可能ですか?

後でテキストを処理するためにPDFリーダーが読み取ったテキストを文字列として保存できるツールを作成することは可能ですか?

Linux Mintには、オペレーティングシステムと共にデフォルトでインストールされる「Xreader」というPDF読み取りツールがあります。

マウスの左ボタンクリックでテキストを選択すると、読み込んだテキストをBashまたはPython文字列に保存して、保存したテキストをBashおよび/またはPythonツールを使用して処理できるツールを作成できますか? Linux Mintには、そのようなことを達成するために使用できる「メカニズム」がありますか?

言う。 PDFリーダー(Xreaderなど)で開いたPDFから受け取ったテキストを処理できるPythonスクリプトを作成しようとしています。

  1. PDFリーダーを介してPDFファイルを開きます。
  2. マウスカーソルを使って興味のあるテキストを選択します。
  3. テキストをインポートしたがすでに処理した結果、たとえば不要なスペースを削除して翻訳を行った場合
  4. その結果、添付のグラフィックウィンドウにテキストがマッピングされます。

ベストアンサー1

GhostscriptはPDFファイルからテキストを抽出できます。

gs -sDEVICE=txtwrite -sOutputFile=myfile.txt -dBATCH -dNOPAUSE myfile.pdf

おすすめ記事