вторник, 25 сентября 2012 г.

Способы преобразования документа - изображения в документ - текст


Один из способов преобразования документа-изображения в документ-текст:
  1. Запускаем программу Microsoft Office Document Scanning 
  2. Сканируем и распознаём документ как текст, предварительно указав язык текста;
  3. Сохраняем с расширением .doc, .txt, .rtf;
Но для себя при этом сделаем печальный вывод: много ошибок при распознавании и, если текст сложный с колонками, таблицами то эффект от проделанной работы нулевой. Эта программа потеряла свою актуальность, наверное, ещё лет 10 назад. На смену данной прикладной программе пришло целое семейство распознающих текст программных продуктов сочетающих в себе: А) возможность выполнить работу в режиме онлайн; Б) процесс сканирования  можно заменить на фотографирование; В) колонки, таблицы   и т.п. читается; Д) бесплатно!!!!!
Вот, например, как рекламирует свой продукт известная фирма ABBYY:

извлечение текста из документа фотографии, сделанные
на ходу

Используйте свой цифровой фотоаппарат, смартфон или IPad сфотографировать текст, если сканер недоступен. С FineReader Online вы можете превратить снимки в Word, ODT, RTF, или другие форматы, которые вы можете редактировать и хранить. Вам не нужно делать заметки, переписывать или перепечатывать текст самостоятельно. FineReader Online распознавания текста является идеальным решением, когда необходимо извлечь текст из картинки!
http://finereader.abbyyonline.com/en/Account/ExtractText

 «Бесплатные аналоги» вроде CuneiForm предлагают невысокое качество распознавания и по функциональности напоминают FineReader 4 десятилетней давности.
Хорошая новость — с недавних пор доступен онлайновый сервис FineReader Online. Пока он находится в стадии бета-тестирования и потому бесплатен. Работать предельно просто: регистрируемся, загружаем файл, ставим нужные галочки, скачиваем результат. Идеально для эпизодического распознавания нескольких страничек или фотографий.