Анализ методов автоматической классификации документов
Роль классификации документов в решении задач информационного поиска. Методы автоматической классификации документов и этапы построения классифицирующей системы: индексация документа, построение классификаторов на базе обучающих данных, оценка их работы.
Подобные документы
Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.
презентация, добавлен 10.03.2015Создание системы предобработки данных; разработка системы классификации на базе методов и алгоритмов машинного обучения, их реализация в программной системе. Предобработка информации, инструкция пользователя, система классификации, машинный эксперимент.
дипломная работа, добавлен 31.01.2015Обоснование выбора метода извлечения ключевых слов. Анализ предметной области, проектирование информационной системы поиска релевантных документов. Реализация запросов к электронным библиотекам. Реализация интерфейса системы поиска релевантных документов.
дипломная работа, добавлен 21.09.2016Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.
дипломная работа, добавлен 19.05.2011Подсчет количества зарегистрированных в базе данных предприятия документов каждого типа, для каждого подписывающего лица, количества документов, которые он подписал. Подсчет для каждого ключевого слова количества документов, в которых оно встречается.
контрольная работа, добавлен 27.06.2013Пример дерева решений. Анализ древовидной структуры данных. Предикторные (зависимые) переменные как признаки, описывающие свойства анализируемых объектов. Решение задач классификации и численного прогнозирования с помощью деревьев классификации.
презентация, добавлен 09.10.2013Характеристика основных патентных баз данных, используемых при проведении патентно-информационного поиска в Интернете. Стратегия патентного поиска и системы патентной классификации. Использование логических операторов и ключевых слов при поиске.
презентация, добавлен 15.09.2011Понятие, классификации и типы стандартных форм. Этапы ввода и обработки форматированных документов. Требования к системам массового ввода стандартных форм. Подходы к реализации систем обработки форм. Система ABBYY Fine Reader Form и Cognitive Forms.
курсовая работа, добавлен 20.10.2010Характеристика Русского Учебного Корпуса. Типы ошибок в русском учебном корпусе, совместная встречаемость тегов, алгоритм классификации. Проблема несбалансированности выборки. Результаты классификации, вклад признаков в различные классификаторы.
курсовая работа, добавлен 30.06.2017Виды документов и их классификация. Правила оформления телефонограмм. Составление и оформление служебных документов. Понятие и назначение трафарета, разновидности предъявляемые требования. Необходимость соблюдения аккуратности при оформлении документа.
курсовая работа, добавлен 04.12.2010Разработка системы автоматизированного управления электронными документами. Сведения о приложении PHPMyAdmin, об обработчике шаблонов Smarty. Создание базы данных. Редактирование документа, просмотр изменений документов. Создание категорий документов.
дипломная работа, добавлен 25.07.2015Основные особенности нормативного и методического обеспечения архивного хранения электронных документов. Общие требования к организации и проведению учета электронных архивных документов. Рассмотрение инновационных методов учета в делопроизводстве.
курсовая работа, добавлен 31.08.2015Программное обеспечение для получения исходных данных для обучения нейронных сетей и классификации товаров с их помощью. Алгоритм метода обратного распространения ошибки. Методика классификации товаров: составление алгоритма, программная реализация.
дипломная работа, добавлен 07.06.2012Понятие шаблона документа, анализ последовательности действий для его создания. Несколько замечаний по поводу тактики создания шаблонов. Специфика создания документов с использованием слияния. Особенность использования программы Microsoft Graph.
реферат, добавлен 05.10.2011Преимущества использования Word при создании веб-страниц. Его публикация Word в библиотеке документов. Преобразование документа Word в веб-страницу. Функции HTML-конвертора Word97. Пересмотр документа Word и веб-страницы. Отображение закладок в документе.
реферат, добавлен 06.04.2010Проектирование модуля регистрации документов. Анализ предметной области, спецификация требований. Построение диаграммы прецедентов Анализ архитектуры модуля в "OpenText Content Server 16.2". Разработка программы регистрации документов, ее тестирование.
дипломная работа, добавлен 25.08.2017Рабочая область окна и структура MS Excel. Применение и возможности электронных таблиц, преимущества использования при решении задач. Ввод и редактирование данных в ячейках, копирование данных, построение диаграмм, профессиональное оформление документов.
реферат, добавлен 10.06.2010Математический набор. Запуск Equation Editor. Построение образца формулы. Создание кубического корня. Вставка формулы в подкоренное выражение. Построение формулы в знаменателе. Текстовые эффекты. Печать документов.
лабораторная работа, добавлен 10.03.2007Межбиблиотечный абонемент и доставка документов входит в число важнейших средств функционирования информационного пространства. Проблема стандартизации технологии и терминологии в библиотечном деле. Перспективы развития электронной доставки документов.
контрольная работа, добавлен 17.11.2010Исследование основных концепций информационного поиска: булева и векторная модели, индексные термины. Реализация векторной модели в среде Matlab, расчет ранжированных списков документов, реализация оценок качества поиска и листинг программы в Matlab.
отчет по практике, добавлен 17.06.2012Понятие и назначение, принципы классификации электронных обучающих программ, методика ее разработки для поиска аппаратных неисправностей и программных сбоев в компьютере, предъявляемые требования. Аппаратные неисправности компьютера, их диагностика.
дипломная работа, добавлен 03.07.2014Понятие электронного документа, отличие от иных видов документов. Юридическая сила и правовой режим электронного документа и документооборота. Процедуры разрешения конфликтов. Основные типы текстовых электронных документов и выбор средств их оформления.
реферат, добавлен 22.08.2010Информационно-поисковые системы. Создание основных и вспомогательных таблиц, запросов для отбора данных по критериям поиска, отчётов для формирования выходных документов и вывода их на печать в программе Access. Построение функции в Microsoft Excel.
курсовая работа, добавлен 04.05.2015Усвоить технологию работы с объектами текстовых документов и документами в целом. Создать предпосылки для успешного усвоения процедур ввода, редактирования и форматирования данных в других дополнениях MS Office.
лабораторная работа, добавлен 22.05.2007Снижение накладных расходов при ведении учета бумажной документации в малых организациях за счет создания электронной базы документов. Критерии эффективности функционирования структурированной системы хранения документов, особенности ее разработки.
дипломная работа, добавлен 27.01.2016