О поиске сходства интернет-документов с помощью частых замкнутых множеств признаков
Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.
Подобные документы
- 26. Поиск информации
Типология методов поиска. Виды соединения с сетью Интернет. Технологии поиска с использованием тематических каталогов. Поиск информации с использованием ключевых слов. Владение пользовательскими инструментами и техникой. Язык запросов поисковой системы.
курсовая работа, добавлен 29.02.2016 Исследования и развитие спектрального метода. Поиск методов сокращения времени выбора эффективных целевых функций (ЦФ) оптимизационных задач. Взаимосвязь между сложностью поиска оптимального решения ЦФ при помощи генетических алгоритмов и её ландшафтом.
статья, добавлен 17.01.2018Принципы добычи текстов из больших массивов данных. Разработка программ для распознавания образов искусственным интеллектом. Классификация способов Data Mining, метод эволюционного программирования. Изучение криптового языка символьных правил PolyAnalyst.
презентация, добавлен 01.11.2020Разработка методологии анализа сигналов с использованием технологии Data Mining, алгоритмов сегментации сигналов, классификации их элементов и построения структурной модели. Создание программного обеспечения, реализующего предложенные алгоритмы.
автореферат, добавлен 31.07.2018Data Mining как метод обнаружения знаний, необходимых для принятия решений в различных сферах деятельности, скрытых в больших объемах исходных данных. Алгоритм решения задачи поиска ассоциативных правил Apriori. Методы визуализации анализируемых данных.
курсовая работа, добавлен 04.07.2013Исследование методов, алгоритмов и программ распознавания текста документов, обеспечивающих высокое качество распознавания. Оптическое распознавание символов, история создания системы. Текущее состояние технологии оптического распознавания текста.
курсовая работа, добавлен 25.06.2011Характеристика особенностей использования гиперграфа для оценки сходства изображений. Разработка и анализ алгоритмов ранжирования гиперграфа. Характеристика дескрипторов свойств и мер сходства. Оценка производительности разработанных алгоритмов.
статья, добавлен 28.11.2016Методи аналізу даних за допомогою інформаційних систем. Консолідація та візуалізація даних в задачах інформаційного бізнесу. Задача асоціації в Data Mining. Кластеризація алгоритмів типу k-means та g-means. Прогнозуючі та класифікаційні моделі.
курсовая работа, добавлен 06.02.2012Изучение информационно-правовых систем на примере системы "Кодекс". Виды поиска документов: интеллектуальный, атрибутный, быстрый. Печать и сохранение правовой информации. Особенности поиска нормативно-технических документов в базах данных "Техэксперт".
курсовая работа, добавлен 06.12.2014- 35. Поиск документов по запросу, расширенному автоматически построенными парадигматическими отношениями
История разработки методов текстового поиска. Применение нечеткого подхода в поисковых машинах Интернет. Автоматические методы построения парадигматических отношений. Экспериментальная оценка поиска по расширенному запросу на текстовой базе малого объема.
статья, добавлен 17.01.2018 Изложение процесса создания сайта по реализации одежды для животных: обзор сетевых предприятий, занимающихся производством и сбытом одежды для животных; разработка бренд-платформы; программная реализация интернет-магазина и сопутствующих приложений.
дипломная работа, добавлен 08.05.2014Возможности применения интеллектуальных методов обработки данных при анализе социальных явлений. Обработка данных анкет студентов, используя аналитическую платформу Deductor. Факторы, оказывающие влияние на "удовлетворенность" выбранной специальностью.
статья, добавлен 14.07.2016- 38. Сравнение эффективности применения классических и интеллектуальных методов решения задач оптимизации
Реализация и применение методов покоординатного спуска, генетических алгоритмов и метода PSO. Выбор функции для оценки качества работы алгоритмов, реализующих методы оптимизации. Разработка программного обеспечения. Мерный вектор псевдослучайных чисел.
курсовая работа, добавлен 13.01.2016 Возможность применения типологии для сужения круга поиска изображений с помощью указания границ значений для каждой координаты. Метод определения частоты встречаемости определённого сочетания признаков и выявления редких/частых сочетаний для пространства.
статья, добавлен 27.06.2021Исследование методов построения систем обучающего компьютерного тестирования. Математическое описание и программная реализация системы обучающего компьютерного тестирования с элементами нечеткой логики и анализ эффективности алгоритмов этой системы.
статья, добавлен 15.07.2018Описание методов поиска угроз веб-приложений с помощью открытых источников информации в сети Интернет. Статистика безопасности веб-приложений и их характеристика. Способы получения закрытой информации на примере использования современных поисковых систем.
статья, добавлен 19.12.2017Сущность и определение понятия интеллектуального анализа данных. Технологии data mining как инструмент для решения сложных аналитических задач. Типы выявляемых закономерностей в системе. Области применения технологий интеллектуального анализа данных.
лекция, добавлен 26.08.2010Анализ существующих систем кредитного скоринга, их основные недостатки. Исследование нескольких алгоритмов data mining и выбор оптимального из них. Описание системы кредитного скоринга, созданной с использованием нейронных сетей и оценка ее эффективности.
статья, добавлен 27.05.2018Характеристика особенностей онтологического подхода для решения задач поиска информации в семантическом пространстве. Исследование методов распознавания текстовой информации в сети интернет для составления единого концепта ассоциации предметных областей.
статья, добавлен 30.01.2016Можливості проведення автоматичного аналізу даних, які надходять з різних оперативно-тактичних джерел та накопичуються у пул різнорідної інформації. Особливості інтелектуалізації баз даних, переваги та недоліки від використання технології Data Mining.
статья, добавлен 02.02.2018Существенный анализ выполнения быстрой рекурсивной сортировки. Реализация поиска подстрок с помощью конечного автомата. Особенность создания объектов на языке Java. Создание улучшенного линейного поиска. Характеристика построения сортировки выбором.
контрольная работа, добавлен 13.01.2020Разработка математических моделей текстов на естественном языке предназначенных для поиска, классификации и кластеризации данных. Таксономическое представление текстовых документов в виде решетки замкнутых структурных синтактико-семантических описаний.
диссертация, добавлен 28.12.2016Этапы информационного поиска - процесса поиска неструктурированной документальной информации. Процесс поиска документов по чисто формальным признакам, указанным в запросе. Оценка соответствия найденных документов запросу (релевантности и точности).
лекция, добавлен 02.05.2014Бесконтактное измерение биометрических параметров состояния здоровья человека. Рассмотрение амплитудного и фазового методов построения алгоритмов для измерения сердечного пульса. Особенности выявления мельчайших движений сердца на видеоизображении.
статья, добавлен 02.03.2018Анализ подхода к построению учебного исследования, связи его этапов с методами и результатами Data Mining. Описание использования системы дистанционного обучения на примере Moodle для практической реализации учебного исследования в рамках дисциплины.
статья, добавлен 29.06.2018