一部のPDFファイルを処理する必要があります。タスクは、与えられた画像ファイルを他の画像ファイルと交換することからなる。最初の質問は、バッチ処理中にコマンドラインからPDFイメージを置き換える方法です。次に、置き換える必要がある画像を識別する方法など、他の問題を解決しようとします(PDFファイルには複数の画像がある可能性があるため)。しかし、まず最初の問題であるPDFの画像を別の画像に置き換える方法を解決したいと思います。
poppler-utilsとpdftkについて読みましたが、私が知っている限り、これらのツールのどれも画像をPDFに置き換えることはできません。
ベストアンサー1
うーん…私の考えでは、pdflatex
それがここで抜けた部分だと思います。
OPは自分が調査をしたと述べpoppler-utils
たpdftk
。何かを追加しますpdfimages
。これらはpdflatex
すべてソリューションの一部です。
pdfimages -f 4 -l 20 -j -png target.pdf imageroot
上記のサンプルコードでは、pdfimages
4ページから20ページに移動して、target.pdf
すべての画像を名前で始まるファイルに抽出しますimageroot
。
poppler-utils
pdftotext
このオプションをお勧めします。文書-layout
を読みやすく保つのに効果的です。
pdftotext -layout $1.pdf $1.txt
imagemagick
提供されたソリューションのOPオブジェクトシールドドラゴン画像に抽出可能なテキストがないことです。私が説明したユーティリティを使用すると、OPにすべての画像と抽出されたすべてのテキストが含まれ、オプションは-layout
ページ番号と内容を保持します。 OPは正しいテキストページを識別し、.tex
ディレクティブで終わるファイルに入れ、%includegraphics
ファイル名参照で画像を置き換えることができます。次に、pdflatex
新しい単一ページの.pdfを取得し、この.pdfを使用して文書の残りの部分を挿入しますpdftk
。元のページテキスト内の画像がどこにあるかを知ることで、%includegraphics [h]
画像を正しい位置に配置できます。