端末のテキストをさまざまなテキスト形式で保存する方法は?

端末のテキストをさまざまなテキスト形式で保存する方法は?

私はOCRソフトウェアを使用していますが、特にtesseractを使用するのに時間を費やしました。 Linux端末に画像をロードし、tesseractが画像からテキストを抽出できるようになりました。今、引き裂かれたテキストを端末でpdf、odf、txt、およびword形式で自動的に保存する方法を理解しようとしています。

ベストアンサー1

見てみるとman 1 tesseract、次の形式のコマンドを使用して出力を1つ以上の特定の形式で保存できるようです。

tesseract image_file output_file pdf txt

パラメータの4つは、一般的なコマンドの要約でそれぞれ、およびFILEOUTPUTBASE2回​​繰り返される)役割を果たします。CONFIGFILEこのコマンドは2つのファイルoutput_file.pdfoutput_file.txt

おすすめ記事