Разработка алгоритма повышенной точности для оптического распознавания символов с изображений паспортов с использованием библиотеки OCR Tesseract и словарного контроля полученных результатов
Оптическое распознавание символов: процесс, обзор существующих приложений (Abbyy FineReader, CuneiForm, OCRopus и пр.). Трудности распознавания символов. Определение фиксированного шага и сегментация слов. Разделение соединенных и повреждённых символов.
Подобные документы
Общая информация о кодировании символов естественных языков. Метод кодирования Морзе. Способ кодирования Бодо. Система кодирования Холлерита. Системы кодирования ASCII, ISO 646 и EBCDIC. Коды телеграфа. Коды для представления символов китайского языка.
реферат, добавлен 04.01.2009Фрактальное кодирование изображений для распознавания. Анализ пространственного распределения доменных и ранговых блоков, полученных в процессе кодирования. Построение фрактального кода, снижающего влияние дефектов изображения на качество распознавания.
статья, добавлен 27.05.2018Описание поэтапного преобразования бумажного документа в электронный программой FineReader. Сканирование документа и процесс распознавания. Редактирование, проверка и сохранение текста. Возможности прямой передачи полученного текста из FineReader в Word.
разработка урока, добавлен 20.08.2010Теория распознавания образов. Цифровая обработка изображений и распознавания образов. Система визуального наблюдения. Применение алгоритма Виолы-Джонса. Методы определения и оценка оптического потока. Применение трекинга при помощи оптического потока.
курсовая работа, добавлен 11.11.2017Разработка принципов и создание системы распознавания номеров железнодорожных вагонов. Ее отличия от систем распознавания автомобильных номерных знаков. Анализ существующих и предложен ряд новых алгоритмов, предназначенных для повышения его точности.
статья, добавлен 26.04.2019История создания и общие сведения о текстовом редакторе Microsoft Word. Возможности и работа с формулами в MS Word. Примеры пошагового набора формул с использованием символов, а также использование вкладки "Вставка", "конструктор" и различных символов.
реферат, добавлен 13.05.2017Управление клавиатурой с помощью скан-кодов. Очистка буфера клавиатуры. Проверка символов в буфере. Ожидание ввода символа и не выведение его на экран. Ожидание нажатия клавиши и эхо на экран. Прием символа без ожидания. Получение строки символов.
реферат, добавлен 07.08.2011Понятие и виды текстовых редакторов. Основы форматирования документа: выбор параметров страницы, форматирование абзацев, символов, таблиц, списков. Компьютерные словари и системы машинного перевода текста. Системы оптического распознавания документов.
контрольная работа, добавлен 25.01.2016Работа с нормативной документацией по охране труда. Технология создания, обработки текстовой информации. Использование цифрового оборудования, систем распознавания текстов. Захват цифрового фото, создание слайдшоу. Задание размеров символов Web-страницы.
методичка, добавлен 02.05.2016Схема кодирования чисел (система счисления) как совокупность символов и правил их комбинации для обозначения числа, ее типы и формы реализации. Код Грея как непозиционный код с одним набором символов (0 и 1) для каждого разряда, принципы формирования.
реферат, добавлен 23.02.2012Рассчитана вероятность появления последовательностей из 5,25 и 100 символов при условии, что алфавит состоит из символов A,B и C. Определен шаг дискретизации, согласуемый с условиями задания. Смоделировано сложный сигнал с помощью программы MatLab.
курсовая работа, добавлен 20.12.2020- 37. Списки и стили
Параметры форматирования символов и абзацев Word. Изменение вида создаваемых документов посредством стилей. Наборы команд форматирования символов, шрифтов и интервалов. Создание многоуровневого списка. Работа с графическими объектами, печать файлов.
лабораторная работа, добавлен 27.10.2016 Что такое регулярные выражения. Основы синтаксиса. Набор символов. Описание предопределённых классов символов, диапазонов, квантификаторов. Сущность квантификации. Скобочные группы. Работа с регулярными выражениями в С++. Общие советы по их использованию.
презентация, добавлен 02.06.2021Разработка нейронной сети для распознавания изображений. Рассмотрение примеров применения машинного обучения в различных областях. Фреймворки и библиотеки для упрощения разработки ботов для Telegram. Создание приложения при помощи нейросети на Python.
отчет по практике, добавлен 20.12.2023Технические средства обработки информации. Системы и устройства автоматизации ввода данных, проектирования, изображений. Программное обеспечение распознавания документов, речи; работа с PDF. Архитектура систем управления процессами распознавания ABBYY.
курсовая работа, добавлен 02.02.2017Использование коротких первичных словарей в двухэтапном алгоритме сжатия символьных данных. Уменьшение времени кодирования на 20–25 %. Основные способы и критерии формирования первичных словарей символов, показатель их итерационного использования.
статья, добавлен 21.09.2018Описание искусственных нейронных сетей. Типы машинного обучения. Анализ существующих библиотек. Разработка алгоритма распознавания дорожных знаков с применением глубоких сверточных сетей и дополнительного классификатора J48. Результаты обучения алгоритма.
дипломная работа, добавлен 30.07.2016Основы форматирования в текстовой редакторе Microsoft Word. Характеристики настройки формата символов (шрифт, начертание, размер символов, эффекты, интервал). Параметры формата абзаца, информация о его форматировании. Функциональное устройство компьютера.
лабораторная работа, добавлен 18.09.2013Понятие машинного зрения и распознавания образов, существующие разработки в области распознавания жестов глухонемых, основные требования и ограничения. Методы и этапы распознавания образов применительно к задаче распознавания языка жестов.
дипломная работа, добавлен 21.09.2018Синтаксис HTML-тегов. Структура HTML-документа. Раздел HEAD и BODY. Коды HTML-символов. Форматирование текста: символов, абзацев. Размещения рисунков, таблиц. Связь между HTML-документами и фрагментами документов. Синтаксис атрибута и карта гиперссылок.
реферат, добавлен 14.01.2014Файловые типы языка Паскаль. Хранение информации в виде строк символов. Организация ввода-вывода в программе. Подпрограммы для работы со всеми типами файлов. Последовательность строк символов переменной длины. Изучение процедуры записи в текстовый файл.
доклад, добавлен 06.02.2013- 47. Аспекты практического применения цветового различия для распознавания и выделения границ изображений
Выделение границ на изображениях при помощи цветового различия. Обоснованное применение современных подходов, касающихся распознавания графической информации. Улучшение методов анализа изображений и выделение весовых для распознавания признаков.
статья, добавлен 29.04.2017 Знакомство с результатами сравнения точности и эффективности распознавания электрокардиограмм различными методами. Рассмотрение основных особенностей влияния объема выборки на точность распознавания. Общая характеристика смешанной гауссовской модели.
курсовая работа, добавлен 24.06.2020Перевод бумажных документов в электронный вид с помощью FineReader. Технология адаптивного распознавания документов ADRT. Возможности интерфейса программы. Алгоритм сканирования PDF- и Word-файлов, распознавание текста. Аналоги программы FineReader.
презентация, добавлен 10.06.2015Виды научно-технической информации и ее обработка. Основные сведения об Интернете и работа с основными веб-браузерами. Система оптического распознавания FineReader. Компьютерные технологии в моделировании и обработке результатов научных исследований.
учебное пособие, добавлен 03.11.2014