色の背景に入力されたテキストを認識するための最高のコマンドラインOCRソフトウェア

色の背景に入力されたテキストを認識するための最高のコマンドラインOCRソフトウェア

次の画像からテキストを抽出する必要があります。

サンプル画像

ご覧のとおり、テキストは手書きのものではなく、入力したものです。しかも背景も華やかだ。

Tesseract OCRを試してみましたが、時々動作しましたが、特定の入力ではひどく失敗しました。上記の例では、「Due CoN aicomrBi em Cela RTL」を生成します。

どのコマンドラインOCRソフトウェアをお勧めしますか? Tesseractが最良の選択であれば、Tesseractのキャラクターをより簡単に識別できるようにこれらの画像を変換できますか?

編集するconvert -threshold 55%:@MarcusMüllerの提案に従って、前景テキストと背景テキストをよりよく分離する作業を行いました。結果画像がずっと良くなりました!

二値化された画像

ああ、Tesseractはまだ動作していません。この新しい画像では、「Bim KM ioes Bm Meme e Cera」が作成されます。

したがって、問題は引き続き開かれています。

ベストアンサー1

不均一な背景でOCR性能が悪い場合は、画像を前処理して前景を抽出するのに役立ちます。

利用可能な技術はさまざまです画像分割/フォアグラウンド抽出。しきい値でうまくやったと思います!おそらくこれを試したり、より高度な抽出器(openCVなど)を使用したり、ニューラルネットワークをトレーニングして自動的に分割を実行したりできます。

さらに、OCRは明るい背景に暗いテキストを使用するとよりうまく機能するため、反転が必要になる場合があります。

おすすめ記事