djvuファイル内の各ページのタイトルとページ番号を抽出できます。

djvuファイル内の各ページのタイトルとページ番号を抽出できます。

これはdjvuバージョンです。PDFファイルに関する以前の質問。私は同様のアイデアを試しましたFredは以前の質問にすでに答えています。。しかし、私はこの目的でどのコマンドを使用できるかわからないので、djvuファイルのページ数を取得する方法をブロックしました。

完全性を期すために、ここで質問をもう一度説明します。

djvuファイルから各ページのタイトルとページ番号を抽出する方法があるかどうか疑問に思います。いくつかのアプリケーションを介して、またはいくつかのプログラミング言語といくつかのdjvuライブラリを介したプログラミングを介して?

各ページのタイトルは、スライドショー/プレゼンテーションファイルなど、ページの最初の行になければなりません。

出力は次の形式のテキストファイルでなければなりません。

title_of_first_page pagenum_of_first_page
title_of_second_page pagenum_of_second_page
...

ありがとうございます!

ベストアンサー1

似ている.pdfの例、次のスクリプトは、指定されたページで見つかったテキストの最初の行を印刷します(pass head -n 1)。djvused --help端末に入力すると、利用可能なコマンドが表示されます。

djvusedパッケージに含まれていますdjvulibre-bin

if="$HOME/Downloads/The Geometry of Exponential Families.djvu"
pages=$(djvused -e 'n' "$if")
for ((i=1; i<=$pages; i++)) ;do
    printf "%s %d\n" "$(djvused -e 'select '$i'; print-pure-txt' "$if" | head -n 1)" $i
done

おすすめ記事