Linux Mintには、オペレーティングシステムと共にデフォルトでインストールされる「Xreader」というPDF読み取りツールがあります。
マウスの左ボタンクリックでテキストを選択すると、読み込んだテキストをBashまたはPython文字列に保存して、保存したテキストをBashおよび/またはPythonツールを使用して処理できるツールを作成できますか? Linux Mintには、そのようなことを達成するために使用できる「メカニズム」がありますか?
言う。 PDFリーダー(Xreaderなど)で開いたPDFから受け取ったテキストを処理できるPythonスクリプトを作成しようとしています。
- PDFリーダーを介してPDFファイルを開きます。
- マウスカーソルを使って興味のあるテキストを選択します。
- テキストをインポートしたがすでに処理した結果、たとえば不要なスペースを削除して翻訳を行った場合
- その結果、添付のグラフィックウィンドウにテキストがマッピングされます。
ベストアンサー1
GhostscriptはPDFファイルからテキストを抽出できます。
gs -sDEVICE=txtwrite -sOutputFile=myfile.txt -dBATCH -dNOPAUSE myfile.pdf