Разработка алгоритма повышенной точности для оптического распознавания символов с изображений паспортов с использованием библиотеки OCR Tesseract и словарного контроля полученных результатов
Оптическое распознавание символов: процесс, обзор существующих приложений (Abbyy FineReader, CuneiForm, OCRopus и пр.). Трудности распознавания символов. Определение фиксированного шага и сегментация слов. Разделение соединенных и повреждённых символов.
Подобные документы
Исследование методов, алгоритмов и программ распознавания текста документов, обеспечивающих высокое качество распознавания. Оптическое распознавание символов, история создания системы. Текущее состояние технологии оптического распознавания текста.
курсовая работа, добавлен 25.06.2011Анализ принципов применения признаковых классификаторов для распознавания символов. Определение требований, которым должны удовлетворять используемые признаковые классификаторы. Разработка и обоснование их модификаций, удовлетворяющих этим требованиям.
статья, добавлен 18.01.2018Обзор систем оптического распознавания изображений: ABBYY Finereader, SimpleOCR, FreeOCR, Microsoft Office Document Imaging. Алгоритм распознавания образов: захват кадра; предварительная обработка (предобработка); локализация и распознавание объекта.
реферат, добавлен 08.06.2019Виды сканеров (ручной, планшетный, протяжной), технические характеристики (разрешающая способность, разрядность, шум, производительность, интерфейс и пр.) и принципы работы. Программное обеспечение распознавания информации: ABBYY FineReader и пр.
реферат, добавлен 14.01.2015Анализ эффективности методов оптического распознавания символов, решающих проблему наличия на изображении различных видов искажений. Измерения критериев и алгоритмов оценки эффективности анализируемых методов для каждого из наборов исходных данных.
статья, добавлен 30.04.2018Описание основ построения нейронных сетей, включая сверточные нейросети. Рассматривается способ реализации механизма распознавания английских рукописных символов и цифр на основе полносвязной и свёрточной нейросетей с использованием фреймворка PyTorch.
статья, добавлен 06.09.2021Особенность обнаружения символов и распознания текста с изображения при помощи Tesseract-OCR. Характеристика создания и работы Tesseract. Взаимодействие Tesseract-OCR с языком программирования Python. Анализ последовательности оптического распознавания.
статья, добавлен 14.09.2024Понимание изображения документа, порядок анализа проекционных профилей и преобразование Хафа. Процесс оптического распознавания символов и применение нейронных сетей. Классификация перцептронов, обучение и ограничение. Процесс работы сети Хопфилда.
дипломная работа, добавлен 14.05.2013Обобщение основных подходов к распознаванию текста. Принципы функционирования программного обеспечения OCR – оптического распознавания символов. Контекстное распознавание текста. Нейронные сети. Примеры программ для различных видов распознавания текста.
реферат, добавлен 06.06.2013Анализ существующих методов решения задачи скелетонизации. Предложение гибридного подхода, который основан на использовании искусственных иммунных систем. Определение направлений исследований, ориентированных на решение задачи распознавания символов.
статья, добавлен 14.07.2016- 11. Комбинирование классификаторов при распознавании символов. Сравнительный анализ нескольких подходов
Описание способов комбинирования классификаторов в задаче распознавания символов. Различные методы реализации этапов комбинирования, их сочетания. Эксперимент, заключающийся в распознавании множества изображений отдельных заглавных букв английского языка.
статья, добавлен 18.01.2018 Распознавание символов по скелетному изображению, использование нейронной сети. Вычисление набора признаков скелета символа, его идентификации по результатам обучения нейронной сети. Устойчивость алгоритма к искажениям символов и параметрам шрифта.
статья, добавлен 25.09.2012Изучение работы перцептрона для решения задачи распознавания символов. Выбор и обоснование структуры нейронной сети. Возможность улучшения свойств обобщения путем наращивания ее структуры. Анализ работы перцептрона при распознавании двух, четырех букв.
статья, добавлен 14.07.2016Анализ разработки алгоритма и программы для решения задачи с использованием строк символов. Замена в строке символов пробела на точки при помощи преобразования в массив символов. Особенность модификации строк. Проведение исследования кода программы.
отчет по практике, добавлен 20.05.2020Требования к активации и регистрации системы оптического распознавания текстов, предназначенной для конвертирования документов и изображений. Перечень поддерживаемых форматов в редакторе ABBYY FineReader. Правила редактирования гиперссылок и таблиц.
учебное пособие, добавлен 15.09.2015Анализ библиотек оптического распознавания символов. Описание пользовательского сценария мобильного приложения. Модули сканирования и распознавания визитных карточек, отображения сохранённых контактов, настроек приложения. Дизайн интерфейса программы.
дипломная работа, добавлен 04.12.2019Распознавание по отпечаткам пальцев. Идентификация по геометрии руки. Оптическое распознавание символов и электронного перевода текста. Уникальность характеристик человеческого тела. Коэффициент ложного отказа в доступе. Моделирование речевого сигнала.
реферат, добавлен 22.05.2014- 18. Повышение помехоустойчивости "скользящего" корреляционного алгоритма распознавания печатных символов
Помехоустойчивый алгоритм без процедур предварительной сегментации и контурной фильтрации, построенный на основе комбинации корреляционного метода и критерия минимума кодовых расстояний. Анализ с известными алгоритмами распознавания символьной информации.
статья, добавлен 14.07.2016 Анализ способов блочного распознавания символов. Разработка метода распознавания инвентарных номеров железнодорожных подвижных единиц, основанного на комитетной нейроиммунной модели классификации. Обоснование преимуществ использования данного метода.
статья, добавлен 29.06.2017Редактирование текста, осуществление поиска слов и фраз с помощью оптического распознавания текста. Разработка алгоритмов, которые позволяют распознавать символы. Образ страницы и распознавание по шаблонам. Структурный подход и контекстное распознавание.
реферат, добавлен 22.01.2015Анализ основных принципов построения системы автоматического считывания паспортов и виз. Оригинальные алгоритмы обнаружения текстовых строк, определения знако-мест и адаптивной бинаризации изображений. Особенность распознавания символов OCR-B-кода.
статья, добавлен 28.10.2018Рассмотрение задачи разработки интеллектуальной системы распознавания текста на фотографиях и видеокадрах сложных графических сцен. Применение морфологических операций для улучшения качества результата сегментации. Сегментация символов текстовых областей.
статья, добавлен 23.02.2016Особенности разработки интеллектуальной системы распознавания текста на фотографиях и видеокадрах сложных графических сцен. Реализация методов для обнаружения и локализации текстовых областей, распознавания символов с помощью сверточных нейронных сетей.
статья, добавлен 23.02.2016Определение основной задачи распознавания образов в преобразовании уже имеющегося изображения на формально понятный язык символов. Растровые представления изображений. Моделирование изображений растра. Параметрический алгоритм рисования линии.
лекция, добавлен 26.09.2017Общая информация о кодировании символов естественных языков. Метод кодирования Морзе. Способ кодирования Бодо. Система кодирования Холлерита. Системы кодирования ASCII, ISO 646 и EBCDIC. Коды телеграфа. Коды для представления символов китайского языка.
реферат, добавлен 04.01.2009