コマンドラインからPDFファイルの正規表現マスク

Question

PDFファイル形式の複雑さに応じて、さまざまなレベルの成功が可能です。

まず、Popplerを使用してPDFファイルをHTMLに変換しますpdftohtml。

pdftohtml -noframes -s <input.pdf>

特定のテキストをぼかしたい場合は、正規表現を使用してください。

sed -i 's/<regexp>/<replacement>/g' <input.html>

HTMLファイルを再びPDFに変換する：

wkhtmltopdf --no-background --enable-local-file-access <input.html> <output.pdf>

wkhtmltopdf余白、サイズ、方向などを調整するには、さまざまなオプションを使用できます。よりman wkhtmltopdf。

Answer 1

PDFファイル形式の複雑さに応じて、さまざまなレベルの成功が可能です。

まず、Popplerを使用してPDFファイルをHTMLに変換しますpdftohtml。

pdftohtml -noframes -s <input.pdf>

特定のテキストをぼかしたい場合は、正規表現を使用してください。

sed -i 's/<regexp>/<replacement>/g' <input.html>

HTMLファイルを再びPDFに変換する：

wkhtmltopdf --no-background --enable-local-file-access <input.html> <output.pdf>

wkhtmltopdf余白、サイズ、方向などを調整するには、さまざまなオプションを使用できます。よりman wkhtmltopdf。

おすすめ記事