Один из способов преобразования документа-изображения в документ-текст:
- Запускаем программу Microsoft Office Document Scanning
- Сканируем и распознаём документ как текст, предварительно указав язык текста;
- Сохраняем с расширением .doc, .txt, .rtf;
Вот, например, как рекламирует свой продукт известная фирма ABBYY:
извлечение текста из документа фотографии, сделанные
на ходу
Используйте свой цифровой фотоаппарат, смартфон или IPad сфотографировать текст, если сканер недоступен. С FineReader Online вы можете превратить снимки в Word, ODT, RTF, или другие форматы, которые вы можете редактировать и хранить. Вам не нужно делать заметки, переписывать или перепечатывать текст самостоятельно. FineReader Online распознавания текста является идеальным решением, когда необходимо извлечь текст из картинки!
http://finereader.abbyyonline.com/en/Account/ExtractText
«Бесплатные аналоги» вроде CuneiForm предлагают невысокое качество распознавания и по функциональности напоминают FineReader 4 десятилетней давности.
Хорошая новость — с недавних пор доступен онлайновый сервис FineReader Online. Пока он находится в стадии бета-тестирования и потому бесплатен. Работать предельно просто: регистрируемся, загружаем файл, ставим нужные галочки, скачиваем результат. Идеально для эпизодического распознавания нескольких страничек или фотографий.