大量の PDF ファイル内のテキストをプログラムで検索して置換するにはどうすればよいでしょうか。一連のファイルに追加された URL を削除したいと思います。Adobe Pro のバッチ処理で JavaScript を使用してリンクを削除できましたが、リンク テキストは残っています。手動で機能するテキスト タッチアップを使用するように勧められているのを見ましたが、1300 個のファイルを手動で変更したくありません。
ベストアンサー1
PDF 内のテキストの検索は、文書形式のグラフィックの性質上、本質的に難しい場合があります。検索する文字がファイル内で連続していない可能性があります。とはいえ、CAM::PDFいくつかの検索置換機能とヒューリスティックを備えています。ページ文字列の変更試してみて、PDF で機能するかどうかを確認してください。
インストールするには:
$ cpan install CAM::PDF
# start a new terminal if this is your first cpan module
$ changepagestring.pl input.pdf oldtext newtext output.pdf