PDFファイルがあります。このファイルのブックマークをテキストファイルまたはExcelスプレッドシートに抽出する必要があります。また、大容量PDFファイルのブックマークを確認する必要があります。どうすればいいですか?
ベストアンサー1
あなたはそれを使用することができますpdftkPDFファイルからデータ(特にブックマーク)を抽出します。
例:pdftk 2.02を使用して、
pdftk file.pdf dump_data_utf8 | grep '^Bookmark'
ブックマークリストを出力します。各ブックマークには4行があり、形式は次のとおりです。
BookmarkBegin
BookmarkTitle: <title in UTF8>
BookmarkLevel: <number>
BookmarkPageNumber: <number>
たとえば、レベル 1 はセクションに対応し、レベル 2 はサブセクションに対応する式です。dump_data_utf8
代わりに、dump_data
ASCII以外の文字(è
「è」など)のHTML / XML数値エンティティを提供できます。
注:そうでない場合は、grep
メタデータ(作成日、作成者、キーワード、タイトルなど)、ページ数、各ページサイズなどの他の興味深いデータを取得できます。 pdftkユーティリティは、PDFファイルに対して他の操作を実行できます。マニュアルページ完全な説明を見るには。