オペレーティングシステム Ubuntu。
必要 端末(QuarkXPressアプリケーションのバインディングレイヤなど)からPDFからテキストまたはより多くのデータへのリンクを取得します。
試験を終えた PDFをテキストとしてところで、リンクがエクスポートされていないようです。 pdfgrepそれは同じです。
解決策はありますか?
ありがとうございます。
ベストアンサー1
/URI(...)
おそらく圧縮を削除したら(存在する場合)、コマンドを使用してPDFを手動で抽出できますpdftk
。
pdftk file.pdf output - uncompress | grep -aPo '/URI *\(\K[^)]*'