すべてのPDFアプリケーションは、PDFファイルの幅と高さを混合します。

すべてのPDFアプリケーションは、PDFファイルの幅と高さを混合します。

私は持っていますこのPDFファイルスキャンして作成されました。 PDFビューアで見ると、ページの幅が高さより広いです。

しかし、私が試したすべてのPDFアプリケーションでは、幅を高くして、高さをこのPDFファイルの幅で間違えたようです(下記参照)。

なぜ?

PDFファイルが破損していますか?

PDFアプリケーションが幅と高さを混在させないようにPDFファイルを「修正」する方法は?

  1. 次のコマンドは、幅が高さ(ポイント)より小さいことを示しています。

    $ pdfinfo test.pdf 
    Creator:        Xerox WorkCentre 7830
    Producer:       Xerox WorkCentre 7830
    CreationDate:   Tue Dec 23 00:22:47 2014
    Tagged:         no
    Form:           none
    Pages:          1
    Encrypted:      no
    Page size:      612 x 1008 pts
    Page rot:       90
    File size:      81820 bytes
    Optimized:      no
    PDF version:    1.4
    
  2. 次のコマンドは、幅が高さ(ピクセル単位)より小さいことを示しています。

    $ pdfimages -list test.pdf 
    page   num  type   width height color comp bpc  enc interp  object ID
    ---------------------------------------------------------------------
       1     0 image     864  1400  rgb     3   8  jpeg   no         6  0
       1     1 mask     1236   895  -       1   1  jbig2  no         8  0
       1     2 mask      737   891  -       1   1  jbig2  no        10  0
       1     3 mask      247   381  -       1   1  jbig2  no        11  0
       1     4 mask       44   298  -       1   1  jbig2  no        12  0
       1     5 mask      429     9  -       1   1  jbig2  no        13  0
       1     6 mask       22   258  -       1   1  jbig2  no        14  0
       1     7 mask      130   142  -       1   1  jbig2  no        15  0
    
  3. PDFファイルの左右の余白を切り取るスクリプトを使用しようとしています。pdfcrop.sh ここgsこれはとに基づいているようですpdftk。左右のマージンをそれぞれ116ポイントと20ポイントで測定した。

    スクリプトの使い方は次のとおりです。

      echo " -t \"<left> [<top> [<right> <bottom>]]\""
      echo "    trims outer page edges by the given amounts. Unit is bp. A single number"
      echo "    is used for all trims, two numbers \"<left> <top>\" are applied to the"
      echo "    right and bottom trims alike."
    

    しかし、

    pdfcrop.sh -t "116 0 20 0" test.pdf Trim.pdf

    これにより、上が116ポイント、下が20ポイントカットされます。一方、以下の正しいアプローチは、左を116ポイント、右を20ポイントカットすることです。

    pdfcrop.sh -t "0 116 0 20" test.pdf Trim.pdf

ベストアンサー1

0.

以下は、1ページのサンプルPDFファイルに基づくPNGです。

test.png(test.pdfから変換)

1.

PDFビューアで見ると、ページの幅が高さより広いです。

これがまさにその方法です。

2.

[...]私が試したすべてのPDFアプリケーションでは、幅を高くして、高さをこのPDFファイルの幅で間違えたようです。

あなたが言ったようにそれだけです。〜らしいそうですね。

三。

PDFファイルが破損していますか?

いいえ、そうではありません。

4.

pdfinfo最初のコマンド()が提供したメッセージを無視しました。

Page rot:       90

これは、PDFファイル内のPDFソースコードがビューアにこれを知らせるという意味です。「広さより身長が本当に大きいです」- ページをめくってディスプレイを90度回転させます。

したがって、「すべてのPDFビューアで見ると、ページは高さより広いです」。そうする必要があります。私を見て番号1以上。そして私2回以上。

5.

pdfimagesすべての画像を抽出し、ImageMagickを使用してconvertPNMまたはPBM形式の画像をJPEGに変換できます。

 pdfimages -j test.pdf test-

 for i in *.pbm ; do            \
    convert $i ${i/.pbm/.jpg} ; \
 done

これにより、pdfimages -list質問のコマンドに0〜7回の画像を含む8つの異なる画像が作成されます(「2.」)。

ここにこれらの画像があります。どちらも元のサイズの25%に拡張されているため、スペースが浪費されません。これらはすべてから抽出されたように「自然な」方向に表示されますpdfimages。これは0リストの最初の項目で、番号は次のとおりです。

画像は「自然な」方向に抽出された。幅に比べて確かに背が高いです。

次の画像ペアのサイズは25%に変更されました。上記のmask出力リストの種類の画像を表しますpdfimages

   

  

あなたのスキャナー(および内蔵ソフトウェア)は「よりスマートな」スキャナーです。単にページから単一のTIFFを作成してからPDFシェルに挿入するのではなく、画像を使用してさまざまな部分を最適化したいと思います。「マスク」(アルファチャンネルを使用 - 作成したJPEGでは黒で表示されます)テキストを含むセクション。

幸いなことに、スキャナソフトウェアはそうではありません。「もっと」テキストに圧縮を適用するとスマートで、JBIG2の代わりにJPEG2000を使用します。だからあなたは悪名高い場所に上がることができませんでした。ゼロックススキャンエラー

おすすめ記事