Один из способов преобразования документа-изображения в документ-текст:
- Запускаем программу Microsoft Office Document Scanning
- Сканируем и распознаём документ как текст, предварительно указав язык текста;
- Сохраняем с расширением .doc, .txt, .rtf;
Но для себя при этом сделаем печальный вывод: много ошибок при распознавании и, если текст сложный с колонками, таблицами то эффект от проделанной работы нулевой. Эта программа потеряла свою актуальность, наверное, ещё лет 10 назад. На смену данной прикладной программе пришло целое семейство распознающих текст программных продуктов сочетающих в себе: А) возможность выполнить работу в режиме онлайн; Б) процесс сканирования можно заменить на фотографирование; В) колонки, таблицы и т.п. читается; Д) бесплатно!!!!!
Вот, например, как рекламирует свой продукт известная фирма ABBYY:
извлечение текста из документа фотографии, сделанные
на ходу
Используйте свой цифровой фотоаппарат, смартфон или IPad сфотографировать текст, если сканер недоступен. С FineReader Online вы можете превратить снимки в Word, ODT, RTF, или другие форматы, которые вы можете редактировать и хранить. Вам не нужно делать заметки, переписывать или перепечатывать текст самостоятельно. FineReader Online распознавания текста является идеальным решением, когда необходимо извлечь текст из картинки!
http://finereader.abbyyonline.com/en/Account/ExtractText
«Бесплатные аналоги» вроде CuneiForm предлагают невысокое качество распознавания и по функциональности напоминают FineReader 4 десятилетней давности.
Хорошая новость — с недавних пор доступен онлайновый сервис
FineReader Online. Пока он находится в стадии бета-тестирования и потому бесплатен. Работать предельно просто: регистрируемся, загружаем файл, ставим нужные галочки, скачиваем результат. Идеально для эпизодического распознавания нескольких страничек или фотографий.