PDFで単語数を見つけるコマンドラインユーティリティはありますか?
PDFの単語数を使って読むのにかかる時間を見積もりましょう。 Get the page count of the PDF を使用できますが、qpdf
1 ページにテキストがほとんど含まれている場合があるため、ページ数は本を読むのにかかる時間の誤った見積もりです。
私の目標を達成するための最悪のシナリオは、pandoc
PDFpdftotext
をプレーンテキストに変換し、単語wc
と文字数を計算するために使用することです。しかし、悪いことは、PDFをテキストに変換するのに時間がかかり、単語数を数えるために役に立たない大きなテキストファイルを生成することです。 PDFには数百ページを含めることができるため、このソリューションは効率的ではありません。