そしてqpdf

そしてqpdf

PDFファイルがあります。このファイルのブックマークをテキストファイルまたはExcelスプレッドシートに抽出する必要があります。また、大容量PDFファイルのブックマークを確認する必要があります。どうすればいいですか?

ベストアンサー1

あなたはそれを使用することができますpdftkPDFファイルからデータ(特にブックマーク)を抽出します。

例:pdftk 2.02を使用して、

pdftk file.pdf dump_data_utf8 | grep '^Bookmark'

ブックマークリストを出力します。各ブックマークには4行があり、形式は次のとおりです。

BookmarkBegin
BookmarkTitle: <title in UTF8>
BookmarkLevel: <number>
BookmarkPageNumber: <number>

たとえば、レベル 1 はセクションに対応し、レベル 2 はサブセクションに対応する式です。dump_data_utf8代わりに、dump_dataASCII以外の文字(&#232;「è」など)のHTML / XML数値エンティティを提供できます。

注:そうでない場合は、grepメタデータ(作成日、作成者、キーワード、タイトルなど)、ページ数、各ページサイズなどの他の興味深いデータを取得できます。 pdftkユーティリティは、PDFファイルに対して他の操作を実行できます。マニュアルページ完全な説明を見るには。

おすすめ記事