PDFをテキストに変換する一種のコンバータはありますか?

PDFをテキストに変換する一種のコンバータはありますか?

コマンドラインから一括検索できるように、テキスト形式のPDFファイルが必要です。 Ubuntu、OBSDなどのディストリビューション用のコンバータはありますか?

たぶん関連記事、Ubuntuを使ったOCRここ

ベストアンサー1

様々なオプションがあります!

pdftotext~からポプラすでに言及しました。

持つHaskellプログラムは次のとおりです。pdf2line良い結果。

口径コマンドebook-convertラインプログラム(または口径自体)は、PDFをプレーンテキストまたは他の電子書籍形式(RTF、ePub)に変換するための別のオプションです。

ebook-convert file.pdf file.txt

アビマルコマンドラインで知っているすべての形式間で変換でき、少なくともオプションでPDFインポートプラグインがあります。

abiword --to=txt file.pdf

別のオプションはpodofotextextract次のとおりです。podofo PDFツールライブラリ。私はまだそれを実際に試していません。

Ghostscriptツールpdf2psとその両方を使用している場合は、ps2ascii他のオプションがあります。

実際、他の方法も考えることができますが、今はそれです。 ;)

おすすめ記事