pdfimagesを使用して画像を抽出する際に問題が発生する

Question

PDFには各ページの画像が含まれ、各画像にはスキャナ領域全体が含まれています。 PDFは、実際に含まれる情報の一部のみを表示するために変換、サイズ変更などを行うことができます。

ページを取得する別の方法は次のとおりです。

$ pdftoppm -cropbox -jpeg file.pdf prefix

これにより、画像がインポートされ、pdfファイルの「トリミングボックス」に従って切り捨てられます（以下の説明を参照）。

Answer 1

PDFには各ページの画像が含まれ、各画像にはスキャナ領域全体が含まれています。 PDFは、実際に含まれる情報の一部のみを表示するために変換、サイズ変更などを行うことができます。

ページを取得する別の方法は次のとおりです。

$ pdftoppm -cropbox -jpeg file.pdf prefix

これにより、画像がインポートされ、pdfファイルの「トリミングボックス」に従って切り捨てられます（以下の説明を参照）。

おすすめ記事