まず、以前にこのような質問があればお詫び申し上げます。既存の投稿の中でしばらく検索してみましたが、サポートが見つかりませんでした。
私は、複数ページの検索不可能なPDFをOCRし、そのPDFを画像の上にテキストレイヤーを含む新しいPDFファイルに変換するFedoraのソリューションに興味があります。 Mac OSXまたはWindowsではAdobe Acrobatを使用できますが、Linux(特にFedora)のソリューションはありますか?
これ説明された解決策があるようです。しかし、残念ながら、正確な画像の検索中に失われました。
ベストアンサー1
ocrmypdf
うまく行われており、次のように使用できます。
ocrmypdf in.pdf out.pdf
取付ける:
pip install ocrmypdf
または
sudo apt install ocrmypdf # ubuntu
sudo dnf -y install ocrmypdf # fedora