コマンドラインから一括検索できるように、テキスト形式のPDFファイルが必要です。 Ubuntu、OBSDなどのディストリビューション用のコンバータはありますか?
たぶん関連記事、Ubuntuを使ったOCRここ。
ベストアンサー1
様々なオプションがあります!
pdftotext
~からポプラすでに言及しました。
持つHaskellプログラムは次のとおりです。pdf2line
良い結果。
口径コマンドebook-convert
ラインプログラム(または口径自体)は、PDFをプレーンテキストまたは他の電子書籍形式(RTF、ePub)に変換するための別のオプションです。
ebook-convert file.pdf file.txt
アビマルコマンドラインで知っているすべての形式間で変換でき、少なくともオプションでPDFインポートプラグインがあります。
abiword --to=txt file.pdf
別のオプションはpodofotextextract
次のとおりです。podofo PDFツールライブラリ。私はまだそれを実際に試していません。
Ghostscriptツールpdf2ps
とその両方を使用している場合は、ps2ascii
他のオプションがあります。
実際、他の方法も考えることができますが、今はそれです。 ;)