PDFからチャートを抽出する

PDFからチャートを抽出する

多数のPDFファイルから画像を抽出し、ウェブサイトに表示する必要がある状況に直面しました。私のPDFには「一般」画像と多くの図があります。

使ったpdf2xmljpeg、pm、pbm、およびvec形式の画像を抽出します。 「一般」画像は(主に)jpeg / ppm / pbmとして抽出されますが、そこにはグラフは表示されません。したがって、pdf2xmlはそのイメージを.vecファイルとして保存すると推測します。

だから質問は私のグラフを取得する方法です。私はconvertimagemagickに付属のツールを使用して.vecをjpeg / pngなどに変換しましたが、役に立ちませんでした。

ベストアンサー1

私はpdf2xmlを試したことがありませんが、SourceForgeでその文書を検索している間に見つけました。vec2svg-2.py.vecファイルを.svgに変換するPythonスクリプトのようです。変換するのは難しくありません。静的変数ジェネレータあなたが必要とするすべてのフォーマットについて。

python vec2svg-2.py -i file.vec -o file.svg

おすすめ記事