OCRを使用してスキャンし、TTSエンジンを介してテキストを実行して印刷された本をオーディオに変換したいと思います。これらの本は電子書籍では入手できません。
OCRは、特に古いフォントを含む画像を変換するときにちょっとしたミスをする可能性があるため、エンジンが認識する正しい一致やその他のさまざまな可能性を説明するメタデータでテキストにタグ付けできるOCRエンジンを探しています。エリア。たとえば、ボイステキストエンジンの確率ランキングを表すグレーの色合いで各単語を強調表示する、Google Voiceのボイスメールテキスト変換をご覧ください。
このサービスを提供する計画をご存知ですか?