PDFファイルをOCRしてPDFに保存されているテキストをインポートする方法は？

2024-06-16 • tag-icon

PDFファイルをOCRしてPDFに保存されているテキストをインポートする方法は？

まず、以前にこのような質問があればお詫び申し上げます。既存の投稿の中でしばらく検索してみましたが、サポートが見つかりませんでした。

私は、複数ページの検索不可能なPDFをOCRし、そのPDFを画像の上にテキストレイヤーを含む新しいPDFファイルに変換するFedoraのソリューションに興味があります。 Mac OSXまたはWindowsではAdobe Acrobatを使用できますが、Linux（特にFedora）のソリューションはありますか？

これ説明された解決策があるようです。しかし、残念ながら、正確な画像の検索中に失われました。

ベストアンサー1

ocrmypdfうまく行われており、次のように使用できます。

ocrmypdf in.pdf out.pdf

取付ける:

pip install ocrmypdf

または

sudo apt install ocrmypdf     # ubuntu
sudo dnf -y install ocrmypdf  # fedora

ベストアンサー1

おすすめ記事