Разработка алгоритма повышенной точности для оптического распознавания символов с изображений паспортов с использованием библиотеки OCR Tesseract и словарного контроля полученных результатов

Оптическое распознавание символов: процесс, обзор существующих приложений (Abbyy FineReader, CuneiForm, OCRopus и пр.). Трудности распознавания символов. Определение фиксированного шага и сегментация слов. Разделение соединенных и повреждённых символов.

Подобные документы

  • Исследование методов, алгоритмов и программ распознавания текста документов, обеспечивающих высокое качество распознавания. Оптическое распознавание символов, история создания системы. Текущее состояние технологии оптического распознавания текста.

    курсовая работа, добавлен 25.06.2011

  • Анализ принципов применения признаковых классификаторов для распознавания символов. Определение требований, которым должны удовлетворять используемые признаковые классификаторы. Разработка и обоснование их модификаций, удовлетворяющих этим требованиям.

    статья, добавлен 18.01.2018

  • Обзор систем оптического распознавания изображений: ABBYY Finereader, SimpleOCR, FreeOCR, Microsoft Office Document Imaging. Алгоритм распознавания образов: захват кадра; предварительная обработка (предобработка); локализация и распознавание объекта.

    реферат, добавлен 08.06.2019

  • Виды сканеров (ручной, планшетный, протяжной), технические характеристики (разрешающая способность, разрядность, шум, производительность, интерфейс и пр.) и принципы работы. Программное обеспечение распознавания информации: ABBYY FineReader и пр.

    реферат, добавлен 14.01.2015

  • Анализ эффективности методов оптического распознавания символов, решающих проблему наличия на изображении различных видов искажений. Измерения критериев и алгоритмов оценки эффективности анализируемых методов для каждого из наборов исходных данных.

    статья, добавлен 30.04.2018

  • Описание основ построения нейронных сетей, включая сверточные нейросети. Рассматривается способ реализации механизма распознавания английских рукописных символов и цифр на основе полносвязной и свёрточной нейросетей с использованием фреймворка PyTorch.

    статья, добавлен 06.09.2021

  • Особенность обнаружения символов и распознания текста с изображения при помощи Tesseract-OCR. Характеристика создания и работы Tesseract. Взаимодействие Tesseract-OCR с языком программирования Python. Анализ последовательности оптического распознавания.

    статья, добавлен 14.09.2024

  • Понимание изображения документа, порядок анализа проекционных профилей и преобразование Хафа. Процесс оптического распознавания символов и применение нейронных сетей. Классификация перцептронов, обучение и ограничение. Процесс работы сети Хопфилда.

    дипломная работа, добавлен 14.05.2013

  • Обобщение основных подходов к распознаванию текста. Принципы функционирования программного обеспечения OCR – оптического распознавания символов. Контекстное распознавание текста. Нейронные сети. Примеры программ для различных видов распознавания текста.

    реферат, добавлен 06.06.2013

  • Анализ существующих методов решения задачи скелетонизации. Предложение гибридного подхода, который основан на использовании искусственных иммунных систем. Определение направлений исследований, ориентированных на решение задачи распознавания символов.

    статья, добавлен 14.07.2016

  • Описание способов комбинирования классификаторов в задаче распознавания символов. Различные методы реализации этапов комбинирования, их сочетания. Эксперимент, заключающийся в распознавании множества изображений отдельных заглавных букв английского языка.

    статья, добавлен 18.01.2018

  • Распознавание символов по скелетному изображению, использование нейронной сети. Вычисление набора признаков скелета символа, его идентификации по результатам обучения нейронной сети. Устойчивость алгоритма к искажениям символов и параметрам шрифта.

    статья, добавлен 25.09.2012

  • Изучение работы перцептрона для решения задачи распознавания символов. Выбор и обоснование структуры нейронной сети. Возможность улучшения свойств обобщения путем наращивания ее структуры. Анализ работы перцептрона при распознавании двух, четырех букв.

    статья, добавлен 14.07.2016

  • Анализ разработки алгоритма и программы для решения задачи с использованием строк символов. Замена в строке символов пробела на точки при помощи преобразования в массив символов. Особенность модификации строк. Проведение исследования кода программы.

    отчет по практике, добавлен 20.05.2020

  • Требования к активации и регистрации системы оптического распознавания текстов, предназначенной для конвертирования документов и изображений. Перечень поддерживаемых форматов в редакторе ABBYY FineReader. Правила редактирования гиперссылок и таблиц.

    учебное пособие, добавлен 15.09.2015

  • Анализ библиотек оптического распознавания символов. Описание пользовательского сценария мобильного приложения. Модули сканирования и распознавания визитных карточек, отображения сохранённых контактов, настроек приложения. Дизайн интерфейса программы.

    дипломная работа, добавлен 04.12.2019

  • Распознавание по отпечаткам пальцев. Идентификация по геометрии руки. Оптическое распознавание символов и электронного перевода текста. Уникальность характеристик человеческого тела. Коэффициент ложного отказа в доступе. Моделирование речевого сигнала.

    реферат, добавлен 22.05.2014

  • Помехоустойчивый алгоритм без процедур предварительной сегментации и контурной фильтрации, построенный на основе комбинации корреляционного метода и критерия минимума кодовых расстояний. Анализ с известными алгоритмами распознавания символьной информации.

    статья, добавлен 14.07.2016

  • Анализ способов блочного распознавания символов. Разработка метода распознавания инвентарных номеров железнодорожных подвижных единиц, основанного на комитетной нейроиммунной модели классификации. Обоснование преимуществ использования данного метода.

    статья, добавлен 29.06.2017

  • Редактирование текста, осуществление поиска слов и фраз с помощью оптического распознавания текста. Разработка алгоритмов, которые позволяют распознавать символы. Образ страницы и распознавание по шаблонам. Структурный подход и контекстное распознавание.

    реферат, добавлен 22.01.2015

  • Анализ основных принципов построения системы автоматического считывания паспортов и виз. Оригинальные алгоритмы обнаружения текстовых строк, определения знако-мест и адаптивной бинаризации изображений. Особенность распознавания символов OCR-B-кода.

    статья, добавлен 28.10.2018

  • Рассмотрение задачи разработки интеллектуальной системы распознавания текста на фотографиях и видеокадрах сложных графических сцен. Применение морфологических операций для улучшения качества результата сегментации. Сегментация символов текстовых областей.

    статья, добавлен 23.02.2016

  • Особенности разработки интеллектуальной системы распознавания текста на фотографиях и видеокадрах сложных графических сцен. Реализация методов для обнаружения и локализации текстовых областей, распознавания символов с помощью сверточных нейронных сетей.

    статья, добавлен 23.02.2016

  • Определение основной задачи распознавания образов в преобразовании уже имеющегося изображения на формально понятный язык символов. Растровые представления изображений. Моделирование изображений растра. Параметрический алгоритм рисования линии.

    лекция, добавлен 26.09.2017

  • Общая информация о кодировании символов естественных языков. Метод кодирования Морзе. Способ кодирования Бодо. Система кодирования Холлерита. Системы кодирования ASCII, ISO 646 и EBCDIC. Коды телеграфа. Коды для представления символов китайского языка.

    реферат, добавлен 04.01.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.