О поиске сходства интернет-документов с помощью частых замкнутых множеств признаков

Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.

Подобные документы

  • Анализ современного состояния проблемы поиска кратных центров графа. Перспективы развития методов поиска кратчайших путей. Разработка алгоритма и обоснование выбора языка программирования. Экспериментальное исследование и тестирование программы.

    реферат, добавлен 11.07.2011

  • Сравнение статистики, машинного обучения и Data Mining, методы ее применяемые для решения задач классификации, способы классификации и прогнозирования в процессе решения бизнес-задач, прикладное программное обеспечение для работы с нейронными сетями.

    книга, добавлен 09.09.2012

  • Исследование основных методов противодействия атакам на пароль. Сравнение эффективности атак методом перебора, по словарю и по маске. Атака с помощью программы Advanced Archive Password Recovery Pro. Показатель времени, затраченного на расшифровку пароля.

    лабораторная работа, добавлен 11.12.2014

  • Основные причины и предпосылки уязвимости информации. Сущность и характеристики составных алгоритмов шифрования. Совокупность мероприятий, методов и средств защиты информации, критерии оценки их практической эффективности, а также программная реализация.

    презентация, добавлен 27.04.2016

  • Сайт — система электронных документов частного лица или организации в компьютерной сети под общим адресом. Техническое задание - один из наиболее важных документов, на основе которого осуществляются все последующие этапы разработки интернет ресурса.

    лабораторная работа, добавлен 30.03.2021

  • Основные критерии качества алгоритмов поиска информации в сети Интернет, значение хорошей формулировки запроса для его эффективности. Содержательная экспертиза результатов поиска в Интернете. Типы дополнительных ресурсов, обнаруживающихся через Интернет.

    презентация, добавлен 28.05.2014

  • История развития справочно-правовых систем. Правила поиска документов в системе "Консультант плюс". Поиск документа с помощью быстрого поиска и с помощью карточки. Быстрый доступ к нормативно-справочной информации и оперативные возможности работы.

    контрольная работа, добавлен 17.01.2018

  • Анализ методов и средств поиска информации в сети интернет. Основные способы сохранения найденной информации: прямая печать, сохранение файла как HTML-файла. Загрузка страниц с помощью специальных менеджеров (Download Speeder, Net Vampire, ReGet и др.).

    контрольная работа, добавлен 25.05.2015

  • Первые инструменты поиска Всемирной паутины. Тенденции и перспективы, расширение числа обследуемых документов и увеличение глубины просмотра источника. Стратегические изменения в сфере поискового сервиса, расширение деловой активности в Интернет.

    реферат, добавлен 11.04.2011

  • Рассмотрение современного состояния дел в области структурного анализа систем. Изучение общих подходов к определению структурного сходства и методов анализа структурного сходства графовых моделей систем. Изучение программной реализации методов сходства.

    статья, добавлен 18.01.2018

  • Этапы схемы решения задачи поиска прямых линий на цветном изображении с использованием преобразования Хафа. Общая структура приложения и рассмотрение структуры основной функции. Реализация поиска прямых с использованием функций библиотеки OpenCV.

    контрольная работа, добавлен 25.12.2015

  • Изучение функции "поиска подобных документов" как способа повышения качества информационного поиска в полнотекстовых базах. Алгоритм определения степени семантического сходства текста с эталоном. Схема оценки текстов на семантическое сходство с эталоном.

    статья, добавлен 25.08.2020

  • Исследование специфики математического описания оттенка как базовой характеристики цвета. Описание оригинальных алгоритмов и программ для оттеночного контрастирования изображений. Оценка эффективности применения разработанного метода в целях экспертизы.

    статья, добавлен 29.07.2017

  • Построение аналитической системы на базе многомерного хранилища данных для анализа проблем и прогнозирования развития авиатранспортной системы в России. Применение инструментов интеллектуального анализа и моделей data mining на основе хранилища данных.

    дипломная работа, добавлен 07.03.2016

  • Применение экспоненциальных замкнутых сетей при моделировании многопроцессорных вычислительных систем, анализ их производительности путем расчета среднего числа активных процессоров. Определение оптимальной конфигурации системы с помощью Парето-множеств.

    статья, добавлен 15.07.2013

  • Понятие и основные компоненты сложных технических систем. Исследование методологических проблем выбора сложной технической системы. Анализ особенностей применения методов вербального анализа решений для оптимального выбора сложной технической системы.

    статья, добавлен 17.01.2018

  • Постановка задачи навигация движения, описание алгоритма поиска кратчайшего пути между двумя вершинами графа и анализ программной реализации алгоритма Дейкстры. Графическая реализация полученных результатов с помощью объектно-ориентированного языка С++.

    курсовая работа, добавлен 11.05.2012

  • Характеристика метода самоорганизующегося поиска и описание алгоритмов. Рассмотрение методов модификации исходного множества поиска, внесения избыточных данных. Разработка алгоритма с обратной связью. Построение алгоритма внутреннего СП-кэширования.

    статья, добавлен 03.12.2020

  • Классификация систем индексирования. Реализация автоматического поиска с помощью прямого и инвертированного индексов. Структура полнотекстовой информационно-поисковой системы, механизм ее работы. Организация хранилища документов, виды глобального словаря.

    презентация, добавлен 14.10.2013

  • Ряд разнообразных методов поиска дублирующегося исходного кода в программных продуктах. Различные техники для выявления клонов (softwareclones). Обобщенная схема поиска дублирующихся фрагментов кода. Выбор структур данных и алгоритмов их обработки.

    статья, добавлен 10.08.2018

  • Систематизация состава линейных операторов, близких к ганкелевому, на основе признаков их симметрий. Разработка аналитических и численных методов поиска собственных и сингулярных функций выделенных систематизированных операторов динамических систем.

    автореферат, добавлен 15.02.2018

  • Исследование съемки бумажных документов и кодексов в ближнем инфракрасном диапазоне, как элемента базового источниковедческого анализа. Ознакомление с особенностями мультиспектрального анализа. Изучение примеров применения гиперспектрального анализа.

    статья, добавлен 30.06.2021

  • Consideration of new forms of binary representations of Boolean functions. Analysis of single algebraic and non-inverting classic models of the Reed-Muller. Using technology "EDM - Extended Data Mining". Characteristics of main data mining algorithms.

    статья, добавлен 14.07.2016

  • Развитие и применение компьютерных технологий, типология методов поиска. Техника поиска с использованием поисковых машин, классификация информационных ресурсов и их организация. Определение географических регионов поиска, анализ и сбор информации.

    реферат, добавлен 23.04.2015

  • Исследование и сравнительный анализ различных методов синтаксического анализа информации, хранящейся в XML-файлах. Анализ результатов тестирования методов парсинга на различных контрольных выборках документов, при разном объеме извлекаемых данных.

    статья, добавлен 17.02.2021

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.