Bash、PDFからリンクを取得する

Bash、PDFからリンクを取得する

オペレーティングシステム Ubuntu。

必要 端末(QuarkXPressアプリケーションのバインディングレイヤなど)からPDFからテキストまたはより多くのデータへのリンクを取得します。

試験を終えた PDFをテキストとしてところで、リンクがエクスポートされていないようです。 pdfgrepそれは同じです。

解決策はありますか?

ありがとうございます。

ベストアンサー1

/URI(...)おそらく圧縮を削除したら(存在する場合)、コマンドを使用してPDFを手動で抽出できますpdftk

pdftk file.pdf output - uncompress | grep -aPo '/URI *\(\K[^)]*'

おすすめ記事