Программы для распознавания текста

Распознавание текста.
Автор: Александр Мойсеенко / Опубликовано:05.05.2019 / Последнее обновление: 8.05.2019

Часто в рабочих или личных целях пользователи сталкиваются с необходимостью распознавания текста, с целью извлечения, редактирования или сохранения в другом формате. Наиболее чаще с необходимостью распознавания текста сталкиваются студенты и офисные работники, а ещё переводчики журналов, комиксов и манги. В статье мы рассмотрим настольные и мобильные, а так же облачные сервисы, что помогут быстро и качественно распознать текст.

Программы для компьютера

Настольные программы предназначены для ПК и ноутбука. Такие приложения оптимально держать при регулярном использовании функции распознавания текста.

ABBYY FineReader

Официальная страница

Данная утилита – лидер в области оптического распознавания текста. Программа рассчитана на распознание отсканированных файлов в реальном времени, а так же готовых документов. В процессе конвертирования сохраняется точный размер, цвет и шрифт текста. Готовый документ легко сохранить в PDF или другом формате.

Подробный обзор программы читайте в нашем отдельном материале.

Интерфейс программы.

Основные преимущества:

  • Наличие модуля для сравнения и поиска отличий двух документов.
  • Распознание текста на более 170 языках.
  • Отправка отредактированного документа по электронной почте или сохранение в популярных офисных форматах.
  • Возможность сканирования текста стационарным сканером, МФУ или камерой.
  • Полноценное редактирование PDF файлов: добавление или удаление страниц, изменение текста, установка водяного знака и т.д.
  • Поддержка актуальных версий Windows: 7, 8 и 10.
  • Дружелюбный интерфейс.
  • 30-дневная бесплатная версия для ознакомления.

Основные недостатки:

  • Программа нуждается в покупке лицензионного ключа на год или на постоянной основе. На стоимость влияет версия программы.
  • Некоторые функции не доступны в базовой версии.
  • Высокая стоимость отдельных модулей. Например, модуль для сравнения двух документов на постоянной основе обойдется примерно в 500 USD.
  • Иногда текст распознается некорректно и нуждается в ручном редактировании.
  • При работе с DOC форматом документ обязательно конвертируется в PDF, после чего требуется обратно сохранять отредактированный файл.

Scanitto Pro

Официальная страница

Программа предназначена для сканирования документов и изображений, при этом поддерживает функцию оптического распознавания текста с последующим редактированием. Модель распространения условно-бесплатная. После ознакомления с 30-дневной пробной версией требуется купить лицензионный ключ на год – 500 RUB или же купить программу на постоянной основе за 5500 RUB. Последний вариант позволяет устанавливать программ на любое количество компьютеров в приделах организации.

Программа Scanitto Pro.

Основные возможности:

  • Настройка параметров сканирования – разрешение, цветность, выбор области сканирования, формат сохранения отсканированных файлов.
  • Возможность сохранения файлов в формате PDF.
  • Копирование документов со сканера на принтер.
  • Оптическое распознавание текста, включая быстрое распознание при использовании многоядерных процессоров.
  • Распознание популярных языков: Английский, Итальянский, Русский, Немецкий, Французский, Испанский.
  • Загрузка информации в облачное хранилище.

Основные преимущества:

  • Совместимость со всеми популярными сканерами.
  • Настройка качества сканирования.
  • Поддержка облачных дисков.
  • Функция оптического распознавания текста с сохранением в DOCX, RTF или TXT.
  • Сохранение отсканированных документов в популярные форматы файлов.
  • Поддержка устаревших и актуальных версий ОС Windows.

Основные недостатки:

  • Необходимость покупки лицензии или полной версии программы.
  • Пробная версия действует 30 дней.
  • Мало распознаваемых языков.

OCR CuneiForm

Бесплатная программа для распознания текста отсканированных или сфотографированных документов. Причем в процессе распознания сохраняется исходная структура документа и печатные шрифты. Так же поддерживается редактирование распознанных текстов.

Основные возможности:

  • Сканирование документов при помощи сканера.
  • Оптическое распознавание и редактирование электронных документов/изображений.
  • Пакетная обработка документов.
  • Адаптивное распознавание контента.
  • Периодическое обновление алгоритмов распознавания.

Основные преимущества:

  • Бесплатная модель распространения.
  • Распознавание и редактирование текста.
  • Совместимость с устаревшими версиями ОС Windows – XP, Vista и Se7en.
  • Достойное качество распознания текста и графики.
  • Периодический выход обновлений.

Основные недостатки:

  • В процессе распознания текста возможны подвисания программы.
  • Посредственный интерфейс.

Readiris

Официальная страница

Приложение предназначено для создания и редактирования PDF файлов. Так же для конвертации документов в другие форматы, а ещё конвертирования бумажных вариантов в цифровой формат за счет оптического распознания текста. Правда рукописный текст с обычной тетради распознать не удается.

После короткой регистрации разработчики предлагают бесплатную версию программы для ознакомления. Цена базовой версии на 1 ПК – 49 USD, расширенная – 99 USD, корпоративная – 199 USD. При покупке ключей на несколько ПК предоставляется скидка.

Основные возможности:

  • Создание, редактирование, объединение, сжатие и прочие операции с PDF файлами.
  • Функция оптического распознавания текста.
  • Поддержка 30 языков в базовой версии программы, 138 языков в расширенной и корпоративной версии.
  • Преобразование документов в файлы Microsoft Office .
  • Пакетная обработка документов.

Основные преимущества:

  • Набор необходимых инструментов для работы с PDF файлами.
  • Оптическое сканирование и редактирование изображений/документов.
  • Возможность прослушивания книг и других документов.
  • Преобразование документов в популярные форматы файлов.

Основные недостатки:

  • Необходимость покупки лицензионного ключа.
  • Разграничение возможностей для каждой версии программы. Наиболее функциональна только корпоративная версия.
  • Сложности с распознанием рукописного текста.

Онлайн сервисы

Использование облачных технологий актуально в редких случаях распознания текста и небольшого объема. В таком случае не требуется устанавливать настольную программу, где для нормального функционирования требуется приобрести дорогостоящую лицензию.

Convertio

Официальная страница

Сервис позволяет бесплатно распознать до 10 страниц в день. Свыше нормы требуется регистрация с оплатой предоплаченного пакета. Стоимость минимального пакета в 50 страниц – 5 USD. Детальнее о предоплаченных пакетах смотрите на странице с расценками.

Сервис Convertio.

Основные возможности:

  • Анализ и распознание текста из PDF и популярных графических форматов файлов – PDF, JPG, BMP, GIF, JP2, JPEG, PBM, PCX, PGM, PNG, PPM, TGA, TIFF и WBMP.
  • Пакетная обработка файлов, добавленных с ПК, облачного диска DropBox/Google Drive или по ссылке.
  • Распознание до двух языков. Поддержка 74 языков.
  • Выбор одного и 10 выходных форматов.
  • Настройка распознавания: все страницы или определенный диапазон.
  • Возможность скачать или сохранить результат на облачном диске – DropBox или Google Drive.

Основные преимущества:

  • Распознавание текста из 2 двух форматов, суммарно 15 расширений файлов.
  • Возможность загрузить и обрабатывать несколько файлов сразу.
  • Указание файла с ПК, из облачного диска или по ссылке.
  • Выбор выходного формата распознанного текста.
  • Одновременное распознавание двух языков из 74.
  • Сохранение готового результата на ПК или в облачный диск.

Основные недостатки:

  • Суточное ограничение при распознании – 10 страниц.
  • Что бы распознать больше страниц требуется купить предоплаченный пакет.
  • Одновременно распознаются только 2 языка.
  • Часто не удается распознать страницу.

img2txt

Официальная страница

Бесплатный сервис для распознания текста из PDF и графических файлов.

Облачный сервис img2txt.

Основные возможности:

  • Локальная загрузка файла или с указанием по ссылке.
  • Поддержка распознания 37 языков.
  • Неограниченное количество запросов.
  • Формат загружаемых файлов: pdf, jpg, jpeg, png и bmp.

Основные преимущества:

  • Сервис бесплатный.
  • Нет ограничений на количество распознаний.
  • Не требуется регистрация.
  • Указание до 37 языков при распознавании текста.
  • 5 форматов загружаемых файлов.

Основные недостатки:

  • Максимальный размер файла для распознания – 8 МБ.
  • Ограничение на распознание в 50 страниц за один раз.
  • Невозможно скачать распознанный документ.
  • Мало поддерживаемых форматов для распознания.

Мобильные приложения

Программы для смартфона/планшета позволят отсканировать и оцифровывать текст с изображений на мобильном устройстве. Удобный вариант, когда под рукой нет компьютера или затруднено использование интернета. В качестве примера рассмотрим распознание текста в программе Office Lens. В качестве альтерантивы вам стоит так же обратить внимание на Adobe Scan и Simple OCR.

Microsoft Office Lens – PDF Scanner

СКАЧАТЬ БЕСПЛАТНО

Наиболее функциональное приложение для сканирования и распознания текста. Для оптического распознания требуется сделать фотографию, обрезать участок при необходимости, а затем выбрать вариант – Word (OCR Document). Что бы посмотреть оцифрованный документ на мобильное устройство необходимо установить Word или другой офисный редактор.

Программа Office Lens.

Что касается потребления оперативной памяти, система сообщает о 71 МБ, поэтому программа хорошо сойдет для маломощных устройств. А вот если использовать дополнительно программу Microsoft Word для просмотра распознанного текста, тогда суммарный объем ОЗУ двух программ составит 321 МБ. Минимальная версия Android для установки Office Lens – 5.0 или выше.

Результат распознания текста..

Вывод

Представленные в статье программы позволяют произвести распознавание текста из PDF и графического файла, с целью извлечения текста. Программы для ПК целесообразно держать при регулярном извлечении текста. Так же настольные версии демонстрируют наилучший результат обработки. Облачные сервисы рационально использовать при нечастой обработке. А мобильные программы пригодятся при оцифровке в дорожных условиях или при отсутствии мобильного интернета.

А как часто вы пользуетесь оцифровкой документов? Какой предпочитаете софт? Поделитесь своим мнением в комментариях под статьей.


Статья была Вам полезной?
Поставьте оценку - поддержите проект!

Очень плохоПлохоНормальноХорошоОтлично
Загрузка...



Комментарии пользователей

Нет комментариев