Как работают современные системы распознавания текста? Я просто помню что такие программы еще лет пять назад могли много ошибок допускать особенно если работать надо с иностранным языком.
Есть очень хорошие программы для распознавания текста или как их еще по другому называют - системы ocr. Только вот лучше всего работают платные решения https://smartengines.ru/raspoznavanie-teksta-ocr/ . Хотя на просторах интернета можно найти много бесплатного софта с такими же функциями, но я сам пробовал некоторые проги и показывают они себя в деле не очень хорошо.
Наверное, если этот софт будет сделан на основе нейросетей то он быстро сможет начать работать как надо. Потому что машинное обучение быстро позволяет совершенствовать программный код.