pdfimagesを使用して画像を抽出する：1ページあたり3つの画像を取得する：.jp2、.png、.jb2e

Question

単一の画像をページとして受け取っていると思いましたが、実際には合成物であるという事実に驚きました。雑誌はいくつかの画像がない単純な本よりもグラフィック的に複雑であるため、これは雑誌を保管するために広く使用されています。品質を維持し、最終的に非常に小さなPDFファイルを提供しますが、レンダリングが遅すぎるため、便利ではありません。

今解決策があります。実際にPDFから何も抽出したくありません。 PDFリーダーと同じようにレンダリングしたいです。 Ghostscriptを使用することをお勧めします。次のように動作します。

gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=png16m -r600 -dGraphicsAlphaBits=4 -sOutputFile=./img/img-%03d.png "$pdffilename"

必要に応じて調整してください。

Answer 1

単一の画像をページとして受け取っていると思いましたが、実際には合成物であるという事実に驚きました。雑誌はいくつかの画像がない単純な本よりもグラフィック的に複雑であるため、これは雑誌を保管するために広く使用されています。品質を維持し、最終的に非常に小さなPDFファイルを提供しますが、レンダリングが遅すぎるため、便利ではありません。

今解決策があります。実際にPDFから何も抽出したくありません。 PDFリーダーと同じようにレンダリングしたいです。 Ghostscriptを使用することをお勧めします。次のように動作します。

gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=png16m -r600 -dGraphicsAlphaBits=4 -sOutputFile=./img/img-%03d.png "$pdffilename"

必要に応じて調整してください。

pdfimagesを使用して画像を抽出する：1ページあたり3つの画像を取得する：.jp2、.png、.jb2e

ベストアンサー1

おすすめ記事