О поиске сходства интернет-документов с помощью частых замкнутых множеств признаков
Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.
Подобные документы
Разработка алгоритмов обнаружения и измерения параметров сейсмических волн на фоне шумов в поточном режиме. Исследование их помехоустойчивости и точности оценивания параметров. Реализация программного комплекса для компьютера для геоакустической локации.
автореферат, добавлен 28.04.2018Понятие кластеризации и принципы работы ее алгоритмов. Этапы применения кластерного анализа для получения оптимального результата. Классификация алгоритмов кластеризации. Принцип работы алгоритма LargeItem. Понятие транзакций и проблема их кластеризации.
дипломная работа, добавлен 21.03.2016Основы применения концепции CRM в современных интернет-технологиях. Разработка структуры информационного сайта кафе "Coffecup". Анализ движков сайтов, их достоинства и недостатки. Обоснование выбора языка программирования и выбора программных средств.
курсовая работа, добавлен 01.10.2017Рассмотрение видов графов, существующих параллельных алгоритмов поиска кратчайшего пути, определение областей их применения. Рассмотрение систем навигации и анализ эффективности применения параллельных алгоритмов для поиска кратчайшего пути в графе.
статья, добавлен 16.07.2018Идентификация моделей динамических систем. Исследование способов построения Интернет-соединения. Характеристика дискретного представления ПИД-регулятора. Особенность выбора микроконтроллерной платформы. Изучение погрешности при дифференцировании.
дипломная работа, добавлен 04.12.2019Рассмотрение существующих систем автоматизации онлайн-записи на прием и анализ их функционала. Разработка, описание алгоритмов и реализация автоматизированной информационной системы для онлайн-записи на прием к нотариусу и подготовки шаблонов документов.
статья, добавлен 16.07.2018Анализ алгоритмов поиска и сортировки информации. Обзор основных методов использования алгоритмов сортировки и поиска на алгоритмическом программировании высокого уровня. Сортировка простым выбором или обменом. Сортировка Шелла. Последовательный поиск.
курсовая работа, добавлен 04.08.2013Характеристика рынка программ хранения и обработки документов, сущность пакета программ MS Office. Создание таблицы с помощью Мастера таблиц и Конструктора таблиц. Основные офисные средства составления, хранения, обработки и копирования документов.
контрольная работа, добавлен 29.10.2012Электронный архив как альтернативный способ хранения документов. Сравнительный анализ методов проектирования информационных систем. Нормативно-методическая база документоведения. Учет особенностей электронного архива в конфигурации 1С:Документооборот.
дипломная работа, добавлен 07.09.2018Необходимость и сферы применения поиска с учетом ошибок: поиск документов в интернете, автоматическое исправление орфографических ошибок, вычислительная биология. Особенности и условия эффективности использования интервальных запросов в данном процессе.
презентация, добавлен 17.08.2016Изучение методов поиска нормативных документов в информационно-поисковой системе "Консультант-Плюс". Рассмотрение основных принципов работы с программным путеводителем и правовым навигатором. Специфические особенности различных нормативных документов.
лабораторная работа, добавлен 23.07.2015Исследование инструментов оптимизации достоверности передачи и обработки электронных документов для расширения состава известных технологий и применения в различных предметных областях. Семантическая гиперсеть на основе синтеза моделей нечеткой логики.
статья, добавлен 29.07.2018Особенность использования кластерного анализа в аппаратном обеспечении. Изучение основных видов кластеров. Формирование результатов поиска на основе группировки при поиске файлов и веб-сайтов. Проведение исследования интерфейса программы Statistica.
статья, добавлен 31.03.2019Рассмотрение предназначения электронных таблиц и основных областей их применения. Определение удобства использования наглядности представления информации. Характеристика Microsoft Excel. Изучение процесса подготовки различных табличных документов.
реферат, добавлен 09.09.2015Общая характеристика автомата для поиска подстрок, знакомство с основными возможностями и преимуществами. Особенности применения построенного автомата, предназначенного для поиска абзаца в тексте, анализ примеров. Рассмотрение методов поиска полстроки.
контрольная работа, добавлен 14.05.2013Политика ведущих операторов интернет-поиска Google, Yahoo и Microsoft. Технология поиска информации в Интернете и профессиональных базах. Методы ее нахождения с использованием гипертекстовых ссылок, поисковых машин, с применением специальных средств.
реферат, добавлен 21.05.2013Рассмотрение базовых методов обнаружения разрывов яркости: методов обнаружения точек, прямой линии, контура объекта. Анализ алгоритмов обнаружения прямых линий с помощью преобразований Хафа. Выполнение моделирования этих алгоритмов средствами Matlab.
статья, добавлен 23.01.2021Формирование модели вычислительной системы, выбор топологии сети, задание количества процессоров. Определение графических форм наблюдения за процессом параллельных вычислений. Вычислительные эксперименты по исследованию методов параллельных вычислений.
лекция, добавлен 17.09.2013Выбор языка программирования, системы управления базами данных, фреймворка. Описание системы Google Custom Search и её поисковых запросов. Разработка алгоритма поиска информативных ресурсов и фильтрации информации. Программная реализация алгоритмов.
курсовая работа, добавлен 14.06.2012Анализ алгоритмов построения траектории движущихся объектов на основе сегментации видеоданных. Разработка методов сжатия за счет новых алгоритмов интерполяции отсчетов сигнала и исследование их эффективности. Построение модели кодека программы.
автореферат, добавлен 31.07.2018Способ по предсказанию успешности реакции с помощью методов машинного обучения. Модели с использованием методов глубокого обучения, решающие задачи генерации потенциально неуспешных реакций и классификации реакций на успешно проходящие и некорректные.
дипломная работа, добавлен 24.10.2020Выбор подходящего способа проектирования веб-приложения, его этапы и критерии. Разработка концептуальной схемы БД будущей системы. Программная реализация веб-приложения для заказа товаров через Интернет с использованием средств CGI-программирования.
курсовая работа, добавлен 07.08.2011Использование нейросетевого моделирования для исследования зависимости климатических параметров планеты Земля от орбитальных параметров, приходящей солнечной радиации. Интервальные нейронные сети, реализация алгоритмов прогнозирования временных рядов.
дипломная работа, добавлен 06.07.2016Описание алгоритмов кластеризации, реализующих задачу поиска изображений по содержанию –Content-Based Image Retrieval. Определение признаков изображения, по которым формируются кластеры изображений и рассмотрение способов извлечения данных признаков.
статья, добавлен 29.07.2017Характеристика особенностей объектно-ориентированного программирования. Этапы разработки программных систем с использованием ООП. Объектно-ориентированный подход к описанию биомедицинских данных. Понятие и характеристика Data Mining, его задачи.
реферат, добавлен 16.12.2013