О поиске сходства интернет-документов с помощью частых замкнутых множеств признаков

Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.

Подобные документы

  • Типология методов поиска. Виды соединения с сетью Интернет. Технологии поиска с использованием тематических каталогов. Поиск информации с использованием ключевых слов. Владение пользовательскими инструментами и техникой. Язык запросов поисковой системы.

    курсовая работа, добавлен 29.02.2016

  • Исследования и развитие спектрального метода. Поиск методов сокращения времени выбора эффективных целевых функций (ЦФ) оптимизационных задач. Взаимосвязь между сложностью поиска оптимального решения ЦФ при помощи генетических алгоритмов и её ландшафтом.

    статья, добавлен 17.01.2018

  • Принципы добычи текстов из больших массивов данных. Разработка программ для распознавания образов искусственным интеллектом. Классификация способов Data Mining, метод эволюционного программирования. Изучение криптового языка символьных правил PolyAnalyst.

    презентация, добавлен 01.11.2020

  • Разработка методологии анализа сигналов с использованием технологии Data Mining, алгоритмов сегментации сигналов, классификации их элементов и построения структурной модели. Создание программного обеспечения, реализующего предложенные алгоритмы.

    автореферат, добавлен 31.07.2018

  • Data Mining как метод обнаружения знаний, необходимых для принятия решений в различных сферах деятельности, скрытых в больших объемах исходных данных. Алгоритм решения задачи поиска ассоциативных правил Apriori. Методы визуализации анализируемых данных.

    курсовая работа, добавлен 04.07.2013

  • Исследование методов, алгоритмов и программ распознавания текста документов, обеспечивающих высокое качество распознавания. Оптическое распознавание символов, история создания системы. Текущее состояние технологии оптического распознавания текста.

    курсовая работа, добавлен 25.06.2011

  • Методи аналізу даних за допомогою інформаційних систем. Консолідація та візуалізація даних в задачах інформаційного бізнесу. Задача асоціації в Data Mining. Кластеризація алгоритмів типу k-means та g-means. Прогнозуючі та класифікаційні моделі.

    курсовая работа, добавлен 06.02.2012

  • Характеристика особенностей использования гиперграфа для оценки сходства изображений. Разработка и анализ алгоритмов ранжирования гиперграфа. Характеристика дескрипторов свойств и мер сходства. Оценка производительности разработанных алгоритмов.

    статья, добавлен 28.11.2016

  • Изучение информационно-правовых систем на примере системы "Кодекс". Виды поиска документов: интеллектуальный, атрибутный, быстрый. Печать и сохранение правовой информации. Особенности поиска нормативно-технических документов в базах данных "Техэксперт".

    курсовая работа, добавлен 06.12.2014

  • История разработки методов текстового поиска. Применение нечеткого подхода в поисковых машинах Интернет. Автоматические методы построения парадигматических отношений. Экспериментальная оценка поиска по расширенному запросу на текстовой базе малого объема.

    статья, добавлен 17.01.2018

  • Возможности применения интеллектуальных методов обработки данных при анализе социальных явлений. Обработка данных анкет студентов, используя аналитическую платформу Deductor. Факторы, оказывающие влияние на "удовлетворенность" выбранной специальностью.

    статья, добавлен 14.07.2016

  • Изложение процесса создания сайта по реализации одежды для животных: обзор сетевых предприятий, занимающихся производством и сбытом одежды для животных; разработка бренд-платформы; программная реализация интернет-магазина и сопутствующих приложений.

    дипломная работа, добавлен 08.05.2014

  • Реализация и применение методов покоординатного спуска, генетических алгоритмов и метода PSO. Выбор функции для оценки качества работы алгоритмов, реализующих методы оптимизации. Разработка программного обеспечения. Мерный вектор псевдослучайных чисел.

    курсовая работа, добавлен 13.01.2016

  • Возможность применения типологии для сужения круга поиска изображений с помощью указания границ значений для каждой координаты. Метод определения частоты встречаемости определённого сочетания признаков и выявления редких/частых сочетаний для пространства.

    статья, добавлен 27.06.2021

  • Исследование методов построения систем обучающего компьютерного тестирования. Математическое описание и программная реализация системы обучающего компьютерного тестирования с элементами нечеткой логики и анализ эффективности алгоритмов этой системы.

    статья, добавлен 15.07.2018

  • Сущность и определение понятия интеллектуального анализа данных. Технологии data mining как инструмент для решения сложных аналитических задач. Типы выявляемых закономерностей в системе. Области применения технологий интеллектуального анализа данных.

    лекция, добавлен 26.08.2010

  • Описание методов поиска угроз веб-приложений с помощью открытых источников информации в сети Интернет. Статистика безопасности веб-приложений и их характеристика. Способы получения закрытой информации на примере использования современных поисковых систем.

    статья, добавлен 19.12.2017

  • Анализ существующих систем кредитного скоринга, их основные недостатки. Исследование нескольких алгоритмов data mining и выбор оптимального из них. Описание системы кредитного скоринга, созданной с использованием нейронных сетей и оценка ее эффективности.

    статья, добавлен 27.05.2018

  • Характеристика особенностей онтологического подхода для решения задач поиска информации в семантическом пространстве. Исследование методов распознавания текстовой информации в сети интернет для составления единого концепта ассоциации предметных областей.

    статья, добавлен 30.01.2016

  • Можливості проведення автоматичного аналізу даних, які надходять з різних оперативно-тактичних джерел та накопичуються у пул різнорідної інформації. Особливості інтелектуалізації баз даних, переваги та недоліки від використання технології Data Mining.

    статья, добавлен 02.02.2018

  • Существенный анализ выполнения быстрой рекурсивной сортировки. Реализация поиска подстрок с помощью конечного автомата. Особенность создания объектов на языке Java. Создание улучшенного линейного поиска. Характеристика построения сортировки выбором.

    контрольная работа, добавлен 13.01.2020

  • Разработка математических моделей текстов на естественном языке предназначенных для поиска, классификации и кластеризации данных. Таксономическое представление текстовых документов в виде решетки замкнутых структурных синтактико-семантических описаний.

    диссертация, добавлен 28.12.2016

  • Анализ подхода к построению учебного исследования, связи его этапов с методами и результатами Data Mining. Описание использования системы дистанционного обучения на примере Moodle для практической реализации учебного исследования в рамках дисциплины.

    статья, добавлен 29.06.2018

  • Этапы информационного поиска - процесса поиска неструктурированной документальной информации. Процесс поиска документов по чисто формальным признакам, указанным в запросе. Оценка соответствия найденных документов запросу (релевантности и точности).

    лекция, добавлен 02.05.2014

  • Бесконтактное измерение биометрических параметров состояния здоровья человека. Рассмотрение амплитудного и фазового методов построения алгоритмов для измерения сердечного пульса. Особенности выявления мельчайших движений сердца на видеоизображении.

    статья, добавлен 02.03.2018

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.