OCRでハードコードされた字幕を抽出する方法があるかどうかを知りたいです。後で使用できるようにフレームを抽出した後に画像処理を行う必要がありますかtesseract
?
画像からフレームを抽出し、字幕ではなく色の内容をすべて削除してみましたが、tesseract
後で使用すると恐ろしい結果が得られました。
このような回避策だけを使用すると、良い結果が得られますか?それともtesseract
自分で訓練する必要がありますか?ランダムなムービー写真にランダムなフォントを追加したランダムな引用符を使用してトレーニングデータを作成するのは簡単ですが、トレーニングには時間がかかります。