PDFファイルをOCRしてPDFに保存されているテキストをインポートする方法は?

PDFファイルをOCRしてPDFに保存されているテキストをインポートする方法は?

まず、以前にこのような質問があればお詫び申し上げます。既存の投稿の中でしばらく検索してみましたが、サポートが見つかりませんでした。

私は、複数ページの検索不可能なPDFをOCRし、そのPDFを画像の上にテキストレイヤーを含む新しいPDFファイルに変換するFedoraのソリューションに興味があります。 Mac OSXまたはWindowsではAdobe Acrobatを使用できますが、Linux(特にFedora)のソリューションはありますか?

これ説明された解決策があるようです。しかし、残念ながら、正確な画像の検索中に失われました。

ベストアンサー1

ocrmypdfうまく行われており、次のように使用できます。

ocrmypdf in.pdf out.pdf

取付ける:

pip install ocrmypdf

または

sudo apt install ocrmypdf     # ubuntu
sudo dnf -y install ocrmypdf  # fedora

おすすめ記事