Часто в рабочих или личных целях пользователи сталкиваются с необходимостью распознавания текста, с целью извлечения, редактирования или сохранения в другом формате. Наиболее чаще с необходимостью распознавания текста сталкиваются студенты и офисные работники, а ещё переводчики журналов, комиксов и манги. В статье мы рассмотрим настольные и мобильные, а так же облачные сервисы, что помогут быстро и качественно распознать текст.
Программы для компьютера
Настольные программы предназначены для ПК и ноутбука. Такие приложения оптимально держать при регулярном использовании функции распознавания текста.
ABBYY FineReader
Официальная страницаДанная утилита – лидер в области оптического распознавания текста. Программа рассчитана на распознание отсканированных файлов в реальном времени, а так же готовых документов. В процессе конвертирования сохраняется точный размер, цвет и шрифт текста. Готовый документ легко сохранить в PDF или другом формате.
Подробный обзор программы читайте в нашем отдельном материале.
Основные преимущества:
- Наличие модуля для сравнения и поиска отличий двух документов.
- Распознание текста на более 170 языках.
- Отправка отредактированного документа по электронной почте или сохранение в популярных офисных форматах.
- Возможность сканирования текста стационарным сканером, МФУ или камерой.
- Полноценное редактирование PDF файлов: добавление или удаление страниц, изменение текста, установка водяного знака и т.д.
- Поддержка актуальных версий Windows: 7, 8 и 10.
- Дружелюбный интерфейс.
- 30-дневная бесплатная версия для ознакомления.
Основные недостатки:
- Программа нуждается в покупке лицензионного ключа на год или на постоянной основе. На стоимость влияет версия программы.
- Некоторые функции не доступны в базовой версии.
- Высокая стоимость отдельных модулей. Например, модуль для сравнения двух документов на постоянной основе обойдется примерно в 500 USD.
- Иногда текст распознается некорректно и нуждается в ручном редактировании.
- При работе с DOC форматом документ обязательно конвертируется в PDF, после чего требуется обратно сохранять отредактированный файл.
Scanitto Pro
Официальная страницаПрограмма предназначена для сканирования документов и изображений, при этом поддерживает функцию оптического распознавания текста с последующим редактированием. Модель распространения условно-бесплатная. После ознакомления с 30-дневной пробной версией требуется купить лицензионный ключ на год – 500 RUB или же купить программу на постоянной основе за 5500 RUB. Последний вариант позволяет устанавливать программ на любое количество компьютеров в пределах организации.
Основные возможности:
- Настройка параметров сканирования – разрешение, цветность, выбор области сканирования, формат сохранения отсканированных файлов.
- Возможность сохранения файлов в формате PDF.
- Копирование документов со сканера на принтер.
- Оптическое распознавание текста, включая быстрое распознание при использовании многоядерных процессоров.
- Распознание популярных языков: Английский, Итальянский, Русский, Немецкий, Французский, Испанский.
- Загрузка информации в облачное хранилище.
Основные преимущества:
- Совместимость со всеми популярными сканерами.
- Настройка качества сканирования.
- Поддержка облачных дисков.
- Функция оптического распознавания текста с сохранением в DOCX, RTF или TXT.
- Сохранение отсканированных документов в популярные форматы файлов.
- Поддержка устаревших и актуальных версий ОС Windows.
Основные недостатки:
- Необходимость покупки лицензии или полной версии программы.
- Пробная версия действует 30 дней.
- Мало распознаваемых языков.
OCR CuneiForm
Бесплатная программа для распознания текста отсканированных или сфотографированных документов. Причем в процессе распознания сохраняется исходная структура документа и печатные шрифты. Так же поддерживается редактирование распознанных текстов.
Основные возможности:
- Сканирование документов при помощи сканера.
- Оптическое распознавание и редактирование электронных документов/изображений.
- Пакетная обработка документов.
- Адаптивное распознавание контента.
- Периодическое обновление алгоритмов распознавания.
Основные преимущества:
- Бесплатная модель распространения.
- Распознавание и редактирование текста.
- Совместимость с устаревшими версиями ОС Windows — XP, Vista и Se7en.
- Достойное качество распознания текста и графики.
- Периодический выход обновлений.
Основные недостатки:
- В процессе распознания текста возможны подвисания программы.
- Посредственный интерфейс.
Readiris
Официальная страницаПриложение предназначено для создания и редактирования PDF файлов. Так же для конвертации документов в другие форматы, а ещё конвертирования бумажных вариантов в цифровой формат за счет оптического распознания текста. Правда рукописный текст с обычной тетради распознать не удается.
После короткой регистрации разработчики предлагают бесплатную версию программы для ознакомления. Цена базовой версии на 1 ПК – 49 USD, расширенная – 99 USD, корпоративная – 199 USD. При покупке ключей на несколько ПК предоставляется скидка.
Основные возможности:
- Создание, редактирование, объединение, сжатие и прочие операции с PDF файлами.
- Функция оптического распознавания текста.
- Поддержка 30 языков в базовой версии программы, 138 языков в расширенной и корпоративной версии.
- Преобразование документов в файлы Microsoft Office .
- Пакетная обработка документов.
Основные преимущества:
- Набор необходимых инструментов для работы с PDF файлами.
- Оптическое сканирование и редактирование изображений/документов.
- Возможность прослушивания книг и других документов.
- Преобразование документов в популярные форматы файлов.
Основные недостатки:
- Необходимость покупки лицензионного ключа.
- Разграничение возможностей для каждой версии программы. Наиболее функциональна только корпоративная версия.
- Сложности с распознанием рукописного текста.
Онлайн сервисы
Использование облачных технологий актуально в редких случаях распознания текста и небольшого объема. В таком случае не требуется устанавливать настольную программу, где для нормального функционирования требуется приобрести дорогостоящую лицензию.
Convertio
Официальная страницаСервис позволяет бесплатно распознать до 10 страниц в день. Свыше нормы требуется регистрация с оплатой предоплаченного пакета. Стоимость минимального пакета в 50 страниц – 5 USD. Детальнее о предоплаченных пакетах смотрите на странице с расценками.
Основные возможности:
- Анализ и распознание текста из PDF и популярных графических форматов файлов – PDF, JPG, BMP, GIF, JP2, JPEG, PBM, PCX, PGM, PNG, PPM, TGA, TIFF и WBMP.
- Пакетная обработка файлов, добавленных с ПК, облачного диска DropBox/Google Drive или по ссылке.
- Распознание до двух языков. Поддержка 74 языков.
- Выбор одного и 10 выходных форматов.
- Настройка распознавания: все страницы или определенный диапазон.
- Возможность скачать или сохранить результат на облачном диске – DropBox или Google Drive.
Основные преимущества:
- Распознавание текста из 2 двух форматов, суммарно 15 расширений файлов.
- Возможность загрузить и обрабатывать несколько файлов сразу.
- Указание файла с ПК, из облачного диска или по ссылке.
- Выбор выходного формата распознанного текста.
- Одновременное распознавание двух языков из 74.
- Сохранение готового результата на ПК или в облачный диск.
Основные недостатки:
- Суточное ограничение при распознании – 10 страниц.
- Что бы распознать больше страниц требуется купить предоплаченный пакет.
- Одновременно распознаются только 2 языка.
- Часто не удается распознать страницу.
img2txt
Официальная страницаБесплатный сервис для распознания текста из PDF и графических файлов.
Основные возможности:
- Локальная загрузка файла или с указанием по ссылке.
- Поддержка распознания 37 языков.
- Неограниченное количество запросов.
- Формат загружаемых файлов: pdf, jpg, jpeg, png и bmp.
Основные преимущества:
- Сервис бесплатный.
- Нет ограничений на количество распознаний.
- Не требуется регистрация.
- Указание до 37 языков при распознавании текста.
- 5 форматов загружаемых файлов.
Основные недостатки:
- Максимальный размер файла для распознания – 8 МБ.
- Ограничение на распознание в 50 страниц за один раз.
- Невозможно скачать распознанный документ.
- Мало поддерживаемых форматов для распознания.
Мобильные приложения
Программы для смартфона/планшета позволят отсканировать и оцифровывать текст с изображений на мобильном устройстве. Удобный вариант, когда под рукой нет компьютера или затруднено использование интернета. В качестве примера рассмотрим распознание текста в программе Office Lens. В качестве альтерантивы вам стоит так же обратить внимание на Adobe Scan и Simple OCR.
Microsoft Office Lens — PDF Scanner
СКАЧАТЬ БЕСПЛАТНОНаиболее функциональное приложение для сканирования и распознания текста. Для оптического распознания требуется сделать фотографию, обрезать участок при необходимости, а затем выбрать вариант – Word (OCR Document). Что бы посмотреть оцифрованный документ на мобильное устройство необходимо установить Word или другой офисный редактор.
Что касается потребления оперативной памяти, система сообщает о 71 МБ, поэтому программа хорошо сойдет для маломощных устройств. А вот если использовать дополнительно программу Microsoft Word для просмотра распознанного текста, тогда суммарный объем ОЗУ двух программ составит 321 МБ. Минимальная версия Android для установки Office Lens – 5.0 или выше.
Вывод
Представленные в статье программы позволяют произвести распознавание текста из PDF и графического файла, с целью извлечения текста. Программы для ПК целесообразно держать при регулярном извлечении текста. Так же настольные версии демонстрируют наилучший результат обработки. Облачные сервисы рационально использовать при нечастой обработке. А мобильные программы пригодятся при оцифровке в дорожных условиях или при отсутствии мобильного интернета.
А как часто вы пользуетесь оцифровкой документов? Какой предпочитаете софт? Поделитесь своим мнением в комментариях под статьей.