PDFからパターンを抽出してテキストファイルとして保存する方法

PDFからパターンを抽出してテキストファイルとして保存する方法

シェルを使用してPDFファイルに含まれる特定のパターンをテキストファイルに抽出するには?

ベストアンサー1

PDFはフォーマットされたデータなので、シェルはその内容にアクセスできません。ただし、PDFがインストールされている場合は、テキストを入力してパターンを検索するために使用できますpoppler-utilsconvertgrep

pdftotext my.pdf - | grep 'your_pattern' > example.txt

したがって、ファイルにパターンがありますexample.txt

おすすめ記事