Оптимизация процесса предобработки информации в системах кластеризации высокоразмерных данных
Анализ методики выбора оптимального метода нормализации при построении кластерной структуры объектов. Высокая размерность признакового пространства. Анализ модели системы кластеризации с использованием алгоритма нечеткой кластеризации fuzzy C-means.
Подобные документы
Структурно-функциональное решение интеллектуального репозитория. Подсистема нейросетевой и генетической кластеризации, их особенности, преимущества. Алгоритм параллельного выполнения fcm-кластеризации. Предназначение кроссовера, оценка приспособленности.
статья, добавлен 18.01.2018Исследуются процессы синхронизации, протекающие в осцилляторных сетях различной топологии. Оценка локальной и глобальной синхронизации осцилляторов в сети. Способы использования осцилляторных сетей при решении задач кластеризации N-мерных данных.
статья, добавлен 15.01.2019Описание алгоритмов кластеризации, реализующих задачу поиска изображений по содержанию –Content-Based Image Retrieval. Определение признаков изображения, по которым формируются кластеры изображений и рассмотрение способов извлечения данных признаков.
статья, добавлен 29.07.2017- 29. Нечеткая кластеризация потоков данных с помощью ЕМ-алгоритма на основе самообучения по Т. Кохонену
Описание мягкого вероятностного нечеткого алгоритма кластеризации многомерных данных, последовательно поступающих на обработку в режиме реального времени. Использование алгоритма для решения задач Dynamic Stream Mining в условиях перекрывающихся классов.
статья, добавлен 19.06.2018 Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
дипломная работа, добавлен 30.06.2017Построение средств интеллектуального анализа данных для нечетких реляционных серверов. Задачи кластеризации и выявления зависимостей в форме нечетких продукций. Гибридный алгоритм использования нечеткой нейронной сети в качестве DM для реляционных данных.
статья, добавлен 17.01.2018Результаты обработки поведенческих данных пользователей информационно-образовательного пространства университета. Особенности работы с поведенческими данными, обработка данных для последующего анализа, выделение поведенческих паттернов обучающегося.
статья, добавлен 17.08.2018Применение модели MapReduce в распределенном поиске, сортировке, обращении графа веб-ссылок, обработки статистики логов сети, построении инвертированных индексов и кластеризации документов. Характеристика возможностей и основных компонентов Hadoop.
курсовая работа, добавлен 07.11.2019Кластеризация, решение задач коммивояжера с помощью генетических алгоритмов. Разбиение участников рейда на группы методом древовидной кластеризации, выявление центра сбора участников с помощью генетических алгоритмов. Проверка качества кластеризации.
курсовая работа, добавлен 05.02.2014Применение интеллектуальных средств защиты информации в системах обнаружения атак. Задачи классификации в экспертных системах. Вероятностные методы решения задачи классификации. Применение нейронных сетей в задачах классификации и кластеризации.
статья, добавлен 23.03.2018Анализ структурно-функционального решения интеллектуального хранилища. Индексирование документов как важная операция, обеспечивающая возможности информационного поиска. Особенность адаптации стандартного генетического алгоритма к задаче кластеризации.
статья, добавлен 18.01.2018Исследование проблемы несравнимости многокритериальных альтернатив с использованием метода "Искра". Процедура решения задачи снижения размерности признакового пространства, основанная на использовании комбинации методов вербального анализа решений.
статья, добавлен 19.01.2018Классификация продуктов, выполняющих кластеризацию текстовой информации. Описание платформ RapidMiner, SAS analytics, Demantra, IBM SPSS Modeler, STATISTICA Text Miner. Выбор лучшего программного продукта среди аналогов с помощью метода Т. Саати.
статья, добавлен 07.11.2018Разработка алгоритма обучения технических систем, позволяющего выполнять автоматическую настройку функций принадлежности нечетких (fuzzy) множеств в соответствии с обучающей выборкой. Результаты моделирования алгоритма обучения в системе Matlab.
статья, добавлен 02.02.2019Разработка задачи кластеризации с учётом интеллектуального формирования параметрической модели SQL-запроса. Анализ проблем с производительностью программных систем промышленного или коммерческого уровня. Изучение представлений производительности Oracle.
статья, добавлен 12.01.2018Методика распределения центров сбора данных по центрам обработки данных для однотипных каналов связи и с использованием нескольких типов каналов связи применяемых в системах ЖКХ. Оценка положительного экономического эффекта от применения методики.
статья, добавлен 15.05.2017Задачи Data Mining: описательные и предсказательные, классификации и регрессии, поиска ассоциативных правил, кластеризации. Практическое применение Data Mining. Особенности нечеткой логики, виды физической неопределенности. Процесс обнаружения знаний.
презентация, добавлен 27.04.2023Этапы развития теории нечетких временных рядов. Основные понятия авторегрессии нечеткого временного ряда. Формализованная постановка задачи нечеткой кластеризации. Модель нечетких тенденций с характеризующими параметрами, ее компоненты и уравнения.
статья, добавлен 19.01.2018Способы предобработки количественных признаков обучающей выборки, индивидуальные для признака и интегральные для выборки критерии оптимальности предобработки. Подтверждение ускорения обучения backprop-нейросети при смене заданного способа предобработки.
статья, добавлен 08.02.2013Кластеризация как процесс разделения исследуемого множества объектов на группы "похожих" объектов, называемых кластерами. Методы кластерного анализа и их общая характеристика: метод k-средних, метод ISODATA, агломеративный метод, дивизимный метод.
презентация, добавлен 23.09.2017Анализ модели беспроводной сенсорной сети на основе теории гиперграфов с применением кластеризации сети. Принцип формирования пикосети. Понятие производного радиуса кластера. Использование не совместимых алгоритмов управления информационными потоками.
статья, добавлен 28.02.2017Оценка результативности научных проектов с использованием метода снижения размерности признакового пространства. Их упорядочение по количественным и качественным критериям с использованием метода АРАМИС для групповой сортировки многопризнаковых объектов.
статья, добавлен 16.01.2018Анализ понятия таргетирования – основного инструмента персонализации. Характеристика особенностей персонализации на сайтах. Определение сущности кластеризации (кластерного анализа) — задачи разбиения множества объектов на группы, называемые кластерами.
контрольная работа, добавлен 18.06.2016Обобщенная архитектура системы поддержки принятия решений. Особенности технологии реляционного хранения данных. Представление информации в виде гиперкуба. Графическая иллюстрация задачи кластеризации. Описание математических основ бизнес-аналитики.
дипломная работа, добавлен 09.06.2014Особенности процесса разработки онтологии и информационного наполнения Web-порталов. Визуализация сетей соавторства на основе алгоритма кластеризации. Характеристики элементов одного сообщества. Стратегия комбинированного изображения отношений партономии.
статья, добавлен 18.01.2018