PDFから数式を抽出する

PDFから数式を抽出する

私は機械学習を勉強しており、文献には式が豊富です。

TeXによって生成されたように見える式を次のように抽出できるようにしたいです。

  • .PNG
  • エマルジョン

私は試した:

  • pdfimages- ラスター画像のみを抽出します(公式なし)。
  • pdf2html -c--公式が歪んだ。

ベストアンサー1

おすすめ記事