О поиске сходства интернет-документов с помощью частых замкнутых множеств признаков

Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.

Подобные документы

  • Анализ основных методов поиска информации для обеспечения высокого качества работы модуля поиска информации в базе знаний. Сравнение методов поиска информации, их преимуществ и недостатков. Выбор оптимального метода для поиска инструкций по базе знаний.

    статья, добавлен 20.01.2022

  • Система индексирования полнотекстовых документов, решающая задачу интеллектуального поиска информации по ключевым словам с учетом морфологических особенностей русского языка. Актуальность полнотекстового поиска. Литературный обзор исследований работы.

    статья, добавлен 29.01.2016

  • Сущность методов отсечения. Оптимизация решений с использованием метода ветвей и границ. Правила построения дерева вариантов. Способ оценки верхней границы решения. Особенности оптимизации решений с использованием методов динамического программирования.

    курсовая работа, добавлен 17.07.2017

  • Изучение векторной и линейной моделей индексирования и поиска документов. Коррекция запросов по релевантности. Зависимость между типами поиска и подходами к ним. Определение формата и кодировки документа. Бинарное и морфологическое индексирование.

    доклад, добавлен 09.02.2013

  • Информация, зафиксированная на электронном носителе, которая записывается, сохраняется, передаётся и представляется с помощью компьютерных технологий. Состав и классификация электронных документов. Способ описания элементов документа и структуры данных.

    реферат, добавлен 12.11.2016

  • Классификация систем подготовки текстовых документов. Описание возможностей различных текстовых редакторов и процессоров. Изучение особенностей процессов подготовки текстовых документов на примере Microsoft Word. Редактирование и форматирование текста.

    реферат, добавлен 07.04.2014

  • Произведено исследование методов шифрования каналов связи и выбор наиболее оптимального из них с точки зрения быстродействия для пользователя с учетом ориентации на программно-аппаратную реализацию. исследование существующих криптографических алгоритмов.

    курсовая работа, добавлен 22.04.2014

  • Основные аспекты деятельности интернет-магазина. Процесс проектирования информационной системы. Моделирование деловых процессов с помощью case-средств. Программная реализация проекта BPWin. Функциональная модель интернет-магазина компьютерных товаров.

    курсовая работа, добавлен 21.09.2014

  • Метод поиска MDS матриц на основе сопровождающих матриц. Экспериментальная оценка числа различных миноров для матрицы размером 13х13. Сравнение числа встречаемости дубликатов для матриц размера nхn. Метод поиска MDS матриц на основе кодов Рида-Соломона.

    курсовая работа, добавлен 17.07.2020

  • Рассмотрение содержания способов реализации поиска плагиата с использованием сети интернет. Исследование и характеристика способа реализации и внедрения этих способов для нового программного обеспечения, выполняющих поиск и анализ заимствований.

    статья, добавлен 03.12.2018

  • Математические, программные, организационные виды обеспечения компьютерных информационных технологий. Обработка компьютерной графики и текстовых документов. Навигация и поиск информации в сети Интернет. Работа с электронными сервисами и службами сети.

    учебное пособие, добавлен 01.12.2012

  • Создание и использование архивов электронных документов. Организация учета электронных документов.Обеспечение сохранности электронных документов. Принципы защиты конфиденциальных сведений в архивах. Уничтожение документов с истекшими сроками хранения.

    реферат, добавлен 14.06.2022

  • Назначение текстовых редакторов. Ввод и редактирование текста. Способы создания документов. Выбор параметров страницы. Вставка изображений, формул и других объектов в документ. Копирование, перемещение и удаление фрагментов документа. Поиск и замена.

    реферат, добавлен 15.12.2013

  • Изучение технологии поиска информации по сетевым каталогам и в поисковых серверах. Перечень гиперссылок, входящих в состав раздела. Обозначение выбора поиска по всей России. Определение раздела ссылки. Технология индексного поиска информации в Интернете.

    лабораторная работа, добавлен 10.02.2014

  • Анализ методов и технологий Data Mining. Применение искусственных нейронных сетей. Освоение среды Data Miner и разработка моделей анализа данных с применением программ STATISTICA. Анализ результатов применения моделей прогнозирования и анализа данных.

    дипломная работа, добавлен 14.12.2019

  • Изучение вопросов поиска и распознавания информации в сети Интернет. Характеристика специальных программ, используемых для этих целей - "интеллектуальных агентов". Классификация методов и системы фильтров для поиска информации. Пример работы программы.

    реферат, добавлен 21.02.2013

  • Характеристика основных методов поиска информации в Интернете: использование гиперссылок, поисковых машин, специальных средств, новых ресурсов. Преимущества и недостатки работы поисковых машин. Рекомендации для эффективного поиска информации в сети.

    реферат, добавлен 31.03.2018

  • Использование документов, схем и иллюстраций Visio в интернет-среде с помощью средства просмотра Visio. Изучение окна настройки макета и конструктора. Распространение документов и схем Visio среди участников групп, партнеров, клиентов и других лиц.

    контрольная работа, добавлен 16.06.2020

  • Изучение понятия и разновидностей вредоносных программ, предназначенных для причинения преднамеренного вреда компьютеру. Описание основных исходящих угроз и методов защиты от них. Принципы поиска информации в Интернет с помощью различных поисковых систем.

    контрольная работа, добавлен 19.12.2012

  • Актуальные виды услуг (сервисы), которые оказываются серверами сети Интернет, их характеристика. Служба поиска и просмотра гипертекстовых документов. Электронная почта, телеконференция и группы новостей. Передача файлов и общение в реальном времени.

    реферат, добавлен 06.05.2012

  • Использование программной системы MPRIORITY для принятия решения по выбору системы электронного документооборота. Осуществление контроля движения документов; особенности поиска по разным критериям документов. Возможность создания электронного архива.

    статья, добавлен 19.12.2017

  • Состав и функциональные возможности компьютерных систем подготовки текстовых документов, технология подготовки на основе применения текстового процессора. Состав и назначение операций редактирования. Возможности и особенности технологии подготовки.

    контрольная работа, добавлен 07.04.2014

  • Изучение методов успешного поиска информации в сети Интернет без построения индекса, основываясь только на локальной информации. Описание технологии извлечения содержимого веб-страниц. Характеристика преобразования содержимого страниц с помощью TF-IDF.

    дипломная работа, добавлен 28.08.2016

  • Редактирование текста, осуществление поиска слов и фраз с помощью оптического распознавания текста. Разработка алгоритмов, которые позволяют распознавать символы. Образ страницы и распознавание по шаблонам. Структурный подход и контекстное распознавание.

    реферат, добавлен 22.01.2015

  • Анализ современного состояния проблемы поиска кратных центров графа. Перспективы развития методов поиска кратчайших путей. Разработка алгоритма и обоснование выбора языка программирования. Экспериментальное исследование и тестирование программы.

    реферат, добавлен 11.07.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.