apt-getを使ってTesseractをインストールしましたが、実際には動作しませんでした。どこかでバイナリをダウンロードしてディレクトリに入れて、そのように使用できますか?
今私のTesseractに何の問題がありますか?
tesseract --help
tesseract:Error:Usage:tesseract imagename outputbase [-l lang] [configfile [[+|-]varfile]...]
そして
tesseract test.tif out2.txt -l pol
Unable to load unicharset file /usr/share/tesseract-ocr/tessdata/pol.unicharset
上記のディレクトリにポーランド語をダウンロードして解凍しましたが、唯一のpol.*はpol.traineddateです。
ベストアンサー1
あなたの場合は、以下を使用してポーランド語のサポートもインストールする必要がありますapt
。
sudo apt install tesseract-ocr-polsudo apt search tesseract-ocr-*
他の言語の場合は、言語パックを一覧表示し、その言語と一致するものを選択してください。
sudo apt search tesseract-ocr-*
ルーマニア語の例:
sudo apt search tesseract-ocr-* | grep "Romanian" -b1
減らす
7900-tesseract-ocr-ron/xenial,xenial 3.04.00-2 all
7946: tesseract-ocr language files for Romanian
7990-
それから
sudo apt install tesseract-ocr-ron