Разработка алгоритма повышенной точности для оптического распознавания символов с изображений паспортов с использованием библиотеки OCR Tesseract и словарного контроля полученных результатов

Оптическое распознавание символов: процесс, обзор существующих приложений (Abbyy FineReader, CuneiForm, OCRopus и пр.). Трудности распознавания символов. Определение фиксированного шага и сегментация слов. Разделение соединенных и повреждённых символов.

Подобные документы

  • Описание поэтапного преобразования бумажного документа в электронный программой FineReader. Сканирование документа и процесс распознавания. Редактирование, проверка и сохранение текста. Возможности прямой передачи полученного текста из FineReader в Word.

    разработка урока, добавлен 20.08.2010

  • Теория распознавания образов. Цифровая обработка изображений и распознавания образов. Система визуального наблюдения. Применение алгоритма Виолы-Джонса. Методы определения и оценка оптического потока. Применение трекинга при помощи оптического потока.

    курсовая работа, добавлен 11.11.2017

  • Разработка принципов и создание системы распознавания номеров железнодорожных вагонов. Ее отличия от систем распознавания автомобильных номерных знаков. Анализ существующих и предложен ряд новых алгоритмов, предназначенных для повышения его точности.

    статья, добавлен 26.04.2019

  • История создания и общие сведения о текстовом редакторе Microsoft Word. Возможности и работа с формулами в MS Word. Примеры пошагового набора формул с использованием символов, а также использование вкладки "Вставка", "конструктор" и различных символов.

    реферат, добавлен 13.05.2017

  • Управление клавиатурой с помощью скан-кодов. Очистка буфера клавиатуры. Проверка символов в буфере. Ожидание ввода символа и не выведение его на экран. Ожидание нажатия клавиши и эхо на экран. Прием символа без ожидания. Получение строки символов.

    реферат, добавлен 07.08.2011

  • Понятие и виды текстовых редакторов. Основы форматирования документа: выбор параметров страницы, форматирование абзацев, символов, таблиц, списков. Компьютерные словари и системы машинного перевода текста. Системы оптического распознавания документов.

    контрольная работа, добавлен 25.01.2016

  • Работа с нормативной документацией по охране труда. Технология создания, обработки текстовой информации. Использование цифрового оборудования, систем распознавания текстов. Захват цифрового фото, создание слайдшоу. Задание размеров символов Web-страницы.

    методичка, добавлен 02.05.2016

  • Схема кодирования чисел (система счисления) как совокупность символов и правил их комбинации для обозначения числа, ее типы и формы реализации. Код Грея как непозиционный код с одним набором символов (0 и 1) для каждого разряда, принципы формирования.

    реферат, добавлен 23.02.2012

  • Рассчитана вероятность появления последовательностей из 5,25 и 100 символов при условии, что алфавит состоит из символов A,B и C. Определен шаг дискретизации, согласуемый с условиями задания. Смоделировано сложный сигнал с помощью программы MatLab.

    курсовая работа, добавлен 20.12.2020

  • Параметры форматирования символов и абзацев Word. Изменение вида создаваемых документов посредством стилей. Наборы команд форматирования символов, шрифтов и интервалов. Создание многоуровневого списка. Работа с графическими объектами, печать файлов.

    лабораторная работа, добавлен 27.10.2016

  • Что такое регулярные выражения. Основы синтаксиса. Набор символов. Описание предопределённых классов символов, диапазонов, квантификаторов. Сущность квантификации. Скобочные группы. Работа с регулярными выражениями в С++. Общие советы по их использованию.

    презентация, добавлен 02.06.2021

  • Разработка нейронной сети для распознавания изображений. Рассмотрение примеров применения машинного обучения в различных областях. Фреймворки и библиотеки для упрощения разработки ботов для Telegram. Создание приложения при помощи нейросети на Python.

    отчет по практике, добавлен 20.12.2023

  • Технические средства обработки информации. Системы и устройства автоматизации ввода данных, проектирования, изображений. Программное обеспечение распознавания документов, речи; работа с PDF. Архитектура систем управления процессами распознавания ABBYY.

    курсовая работа, добавлен 02.02.2017

  • Использование коротких первичных словарей в двухэтапном алгоритме сжатия символьных данных. Уменьшение времени кодирования на 20–25 %. Основные способы и критерии формирования первичных словарей символов, показатель их итерационного использования.

    статья, добавлен 21.09.2018

  • Описание искусственных нейронных сетей. Типы машинного обучения. Анализ существующих библиотек. Разработка алгоритма распознавания дорожных знаков с применением глубоких сверточных сетей и дополнительного классификатора J48. Результаты обучения алгоритма.

    дипломная работа, добавлен 30.07.2016

  • Основы форматирования в текстовой редакторе Microsoft Word. Характеристики настройки формата символов (шрифт, начертание, размер символов, эффекты, интервал). Параметры формата абзаца, информация о его форматировании. Функциональное устройство компьютера.

    лабораторная работа, добавлен 18.09.2013

  • Понятие машинного зрения и распознавания образов, существующие разработки в области распознавания жестов глухонемых, основные требования и ограничения. Методы и этапы распознавания образов применительно к задаче распознавания языка жестов.

    дипломная работа, добавлен 21.09.2018

  • Синтаксис HTML-тегов. Структура HTML-документа. Раздел HEAD и BODY. Коды HTML-символов. Форматирование текста: символов, абзацев. Размещения рисунков, таблиц. Связь между HTML-документами и фрагментами документов. Синтаксис атрибута и карта гиперссылок.

    реферат, добавлен 14.01.2014

  • Файловые типы языка Паскаль. Хранение информации в виде строк символов. Организация ввода-вывода в программе. Подпрограммы для работы со всеми типами файлов. Последовательность строк символов переменной длины. Изучение процедуры записи в текстовый файл.

    доклад, добавлен 06.02.2013

  • Выделение границ на изображениях при помощи цветового различия. Обоснованное применение современных подходов, касающихся распознавания графической информации. Улучшение методов анализа изображений и выделение весовых для распознавания признаков.

    статья, добавлен 29.04.2017

  • Знакомство с результатами сравнения точности и эффективности распознавания электрокардиограмм различными методами. Рассмотрение основных особенностей влияния объема выборки на точность распознавания. Общая характеристика смешанной гауссовской модели.

    курсовая работа, добавлен 24.06.2020

  • Перевод бумажных документов в электронный вид с помощью FineReader. Технология адаптивного распознавания документов ADRT. Возможности интерфейса программы. Алгоритм сканирования PDF- и Word-файлов, распознавание текста. Аналоги программы FineReader.

    презентация, добавлен 10.06.2015

  • Виды научно-технической информации и ее обработка. Основные сведения об Интернете и работа с основными веб-браузерами. Система оптического распознавания FineReader. Компьютерные технологии в моделировании и обработке результатов научных исследований.

    учебное пособие, добавлен 03.11.2014

  • Особенности применения нейронной сети с использованием библиотеки OpenCV для распознавания эмоций. Обучение нейронной сети, распознавание лиц из базы данных Yale Facesс помощью обучающего набора данных в рамках авторского проекта "Сурдотелефон".

    статья, добавлен 25.02.2019

  • Эффективность последовательной процедуры распознавания гипотез. Определение геометрических признаков лица, являющихся наиболее подходящими для распознавания. Особенности использования нейросетевого распознавания для определения человека по изображению.

    статья, добавлен 29.04.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.