Python を使用して PDF ファイルを HTML に変換するにはどうすればよいですか?
私は、Google が PDF ファイルをインデックスするために行っていること (または行っているように見えること) について考えていました。
私の最終目標は、PDF ファイルの HTML を表示するように Apache を設定することです。そのために役立つ情報があれば、ぜひ教えてください。
ベストアンサー1
のポプラーパッケージには、使用できる可能性のあるpdf2htmlユーティリティが含まれています。Pythonバインディングlibpoppler へ。