Интеллектуальная кластеризация текстовых данных
Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
Подобные документы
Определение задачи оптимального представления текстовых документов на заключительном этапе функционирования информационно-поисковой системы. Характеристика основных преимуществ использования алгоритма Куна в составе автоматических поисковых серверов.
статья, добавлен 26.04.2017Ознакомление с корпоративными информационными системами и базами данных. Рассмотрение классификации хранилищ данных (Data Warehouse) в корпорациях. Технология комплексного многомерного анализа информации. Оперативная аналитическая обработка данных.
курсовая работа, добавлен 09.02.2014- 53. Базы данных
Компьютерная обработка информации. Иерархическая, сетевая и реляционная модели данных. Структура базы данных. Поля баз данных. Средства, обеспечивающие многопользовательскую работу. Область применения баз данных. Защита от несанкционированного доступа.
курсовая работа, добавлен 22.04.2014 Анализ способов аналитической обработки данных. Изучение технических аспектов многомерного хранения данных. Интеллектуальный анализ данных (Data Mining). Обзор технологий резервного копирования. Анализ технологий хранения резервных копий и данных.
реферат, добавлен 17.09.2017Классификация продуктов, выполняющих кластеризацию текстовой информации. Описание платформ RapidMiner, SAS analytics, Demantra, IBM SPSS Modeler, STATISTICA Text Miner. Выбор лучшего программного продукта среди аналогов с помощью метода Т. Саати.
статья, добавлен 07.11.2018Развитие систем электронного обучения и внедрение цифровых технологий в традиционный образовательный процесс. Анализ направлений методов анализа образовательных данных (АОД) и их особенности в сравнении с методами интеллектуального анализа данных.
курсовая работа, добавлен 24.05.2018- 57. Базы данных
Хранение и обработка больших объемов информации. Понятие информационной системы. Виды структур данных. Виды баз данных. Состав и функции систем управления базами данных. Справочные ограничения целостности. Сетевая структура и организация данных.
реферат, добавлен 13.03.2013 Ведение бухгалтерского учета с использованием табличного процессора Excel. Ввод исходных данных, форматирование текстовых и числовых данных. Изменение содержимого ячеек и оформление таблицы. Создание расчетной таблицы и копирование данных на лист.
курсовая работа, добавлен 10.12.2021Ускорение обработки огромных информационных массивов как одна из основных целей методики обнаружения вредоносного трафика с использованием анализа данных. Особенности настройки гиперпараметров алгоритма, который реализует метод машинного обучения.
статья, добавлен 18.01.2021Широкое распространение приложений для реляционных баз данных и возможность сделать уже имеющиеся в базе данные доступными для вебприложений. Рассмотрение основных методов сопоставления и связи XML документов и соответствующих реляционных общих данных.
статья, добавлен 11.03.2018Таблицы Microsoft Access. Формы документов Visual Basic. Передвигание данных в текстовых полях к первой записи. Вычисление средних значений данных за четырехлетние периоды. Содержание программы сортировки. Структура файлов, использованных в проекте.
курсовая работа, добавлен 22.08.2011Обязательные подсистемы географической информационной системы: ввода данных, хранения и поиска, обработки и анализа, выдачи данных. Технологии создания электронных векторных карт: сканирование, векторизация, наполнение семантических табличных баз данных.
контрольная работа, добавлен 11.01.2013Классификация текстовых процессоров: процессоры общего назначения, редакторы научных документов и исходных текстов программ, издательские системы. Характеристика отдельных текстовых процессоров: Лексикон, AbiWord, OpenOffice.org Writer, Microsoft Word.
курсовая работа, добавлен 13.06.2011Анализ методики выбора оптимального метода нормализации при построении кластерной структуры объектов. Высокая размерность признакового пространства. Анализ модели системы кластеризации с использованием алгоритма нечеткой кластеризации fuzzy C-means.
статья, добавлен 01.03.2017Изучение истории возникновения баз данных, их классификация и виды систем управления базами данных. Рассмотрение реестра документов об образовании и исследованию методических рекомендаций по его ведению и заполнению. Специфика проектирования базы данных.
дипломная работа, добавлен 18.06.2021Работа в MS Excel и работа в MS Access 2002. Объединение сведений из разных источников в реляционной базе данных Microsoft Access. Обновление данных, получение ответов на вопросы, осуществление поиска нужных данных, анализ данных и распечатка отчетов.
курсовая работа, добавлен 18.03.2010Понятие системы управления базами данных, функциональные возможности и классификация. Режимы работы, характеристика СУБД и краткий обзор, объекты баз данных и их назначение. Сравнительный анализ СУБД, технология создания и этапы проектирования баз данных.
курсовая работа, добавлен 13.05.2015- 68. Сегментация изображений в больших базах данных с использованием плотности распределения информации
Задачи сегментации изображений на основе алгоритма кластеризации с использованием плотности распределения информации. Формирование кластеров произвольной формы, обработка сигналов, зашумленных разного вида возмущениями, матричное представление информации.
статья, добавлен 24.03.2016 Ознакомление с объектами кластеризации, которыми являются электронные текстовые документы. Рассмотрение этапов выполнения алгоритма нечеткой кластеризации. Изучение и анализ диаграммы вариантов использования для пользователя исследуемого приложения.
реферат, добавлен 18.01.2018Понятие банка данных, базы данных и СУБД. Логическое представление и система управления базами данных, ее функции: определение, обработка, безопасность, целостность и введение словаря данных. Модели, поддерживаемые СУБД. Области применения БД в экономике.
контрольная работа, добавлен 03.12.2013Значение понятия "скрытые знания". Определение сути методов Data mining. Язык запросов к базам данных. Выявление возможностей для создания, изменения и извлечения хранимых данных. Data mining и искусственный интеллект. Задачи кластеризации и ассоциации.
контрольная работа, добавлен 14.04.2014Ввод и редактирование данных. Форматирование таблиц, проверка правописания. Предварительный просмотр и печать. Обработка табличных данных с помощью встроенных функций. Представление табличных данных в графическом виде. Импорт данных из других программ.
презентация, добавлен 18.02.2014Проведение исследования теоремы о NP-полноте задачи деобфускации при добавлении к запутываемой программе дополнительных входных и выходных данных. Разработка алгоритма перевода машинного кода в промежуточное представление на основе частичной эмуляции.
автореферат, добавлен 31.03.2018Медианное значение токенов на страницу текста на малом языке. Проект по автоматизированному сбору текстовых Интернет-коллекций. Суть регистрационных данных сайтов. Принципы построения ориентированного взвешенного веб-графа для национального Интернета.
дипломная работа, добавлен 27.08.2016Общие сведения и обзор текстовых редакторов как самостоятельных компьютерных программ для создания и изменения текстовых данных. Проектирование приложения, читающего форматы doc и rtf; реализация его основных особенностей; интерфейс пользователя.
курсовая работа, добавлен 04.05.2014