Bash、PDFからリンクを取得する

2024-06-26 • tag-icon

command-line pdf text

オペレーティングシステム Ubuntu。

必要端末（QuarkXPressアプリケーションのバインディングレイヤなど）からPDFからテキストまたはより多くのデータへのリンクを取得します。

試験を終えた PDFをテキストとしてところで、リンクがエクスポートされていないようです。 pdfgrepそれは同じです。

解決策はありますか？

ありがとうございます。

/URI(...)おそらく圧縮を削除したら（存在する場合）、コマンドを使用してPDFを手動で抽出できますpdftk。

pdftk file.pdf output - uncompress | grep -aPo '/URI *\(\K[^)]*'

おすすめ記事