Интеллектуальная кластеризация текстовых данных
Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
Подобные документы
Ознакомление с объектами кластеризации, которыми являются электронные текстовые документы. Рассмотрение этапов выполнения алгоритма нечеткой кластеризации. Изучение и анализ диаграммы вариантов использования для пользователя исследуемого приложения.
реферат, добавлен 18.01.2018Понятие банка данных, базы данных и СУБД. Логическое представление и система управления базами данных, ее функции: определение, обработка, безопасность, целостность и введение словаря данных. Модели, поддерживаемые СУБД. Области применения БД в экономике.
контрольная работа, добавлен 03.12.2013Значение понятия "скрытые знания". Определение сути методов Data mining. Язык запросов к базам данных. Выявление возможностей для создания, изменения и извлечения хранимых данных. Data mining и искусственный интеллект. Задачи кластеризации и ассоциации.
контрольная работа, добавлен 14.04.2014Ввод и редактирование данных. Форматирование таблиц, проверка правописания. Предварительный просмотр и печать. Обработка табличных данных с помощью встроенных функций. Представление табличных данных в графическом виде. Импорт данных из других программ.
презентация, добавлен 18.02.2014Проведение исследования теоремы о NP-полноте задачи деобфускации при добавлении к запутываемой программе дополнительных входных и выходных данных. Разработка алгоритма перевода машинного кода в промежуточное представление на основе частичной эмуляции.
автореферат, добавлен 31.03.2018Медианное значение токенов на страницу текста на малом языке. Проект по автоматизированному сбору текстовых Интернет-коллекций. Суть регистрационных данных сайтов. Принципы построения ориентированного взвешенного веб-графа для национального Интернета.
дипломная работа, добавлен 27.08.2016Общие сведения и обзор текстовых редакторов как самостоятельных компьютерных программ для создания и изменения текстовых данных. Проектирование приложения, читающего форматы doc и rtf; реализация его основных особенностей; интерфейс пользователя.
курсовая работа, добавлен 04.05.2014Методы и модели оценки количества информации. Формы ее представления и преобразования. Цели ее кодирования. Единицы измерения данных. Правила перехода из одной системы счисления в другую. Принципы кодирования текстовых, звуковых и графических данных.
презентация, добавлен 29.11.2016Возможности использования методов машинного обучения для анализа реальных данных по вибрации ключевых узлов центробежного компрессора. Дерево решения для массива данных, полученных в одном из нефтеперерабатывающих заводов. Критерии оценки отказа
статья, добавлен 09.09.2024Базы данных и системы управления базами данных. Режимы работы с ними. Свойства полей базы данных. Объекты базы данных: таблицы, запросы и формы. Разработка технического задания и структуры базы данных. Основные типы данных и безопасность баз данных.
контрольная работа, добавлен 31.01.2011Основные элементы концепции хранилищ данных. Архитектуры глобальных хранилищ данных. Взаимосвязанные и независимые магазины данных. Анализ методов повышения эффективности алгоритмов обработки хранимых данных в связи с валообразным увеличением их объема.
статья, добавлен 15.08.2020Применение кластеризации данных для решения задачи группировки графических образов. Построение схемы последовательной кластеризации сложной графической информации. Обзор вопроса выбора меры различия, учитывающей степень визуального сходства изображений.
статья, добавлен 31.08.2018Общее понятие данных. Процедуры обработки данных в зависимости от видов представления данных. Организационные формы использования информационных технологий при обработке данных. Особенности и технологический процесс обработки экономической информации.
курсовая работа, добавлен 08.05.2014Понятие информации, данных и правила их смысловой интерпретации. Архитектура и основные компоненты банка данных: датологическое представление информационной модели ПО и система управления базой данных. Классификация моделей данных, их характеристика.
реферат, добавлен 11.07.2011Основные понятия концептуальной схемы данных базы данных и системы управления базами данных. Правила определения сущностей. Виды архитектур распределенных баз данных. Анализ используемых архитектур сетевых баз данных в рекламном агентстве "Софит".
дипломная работа, добавлен 31.03.2016Группировка данных, запросы на создание и обновление данных. Связывание таблиц, построение выборки данных. Использование ключевых слов Left, Right, Where. Примеры запросов с группировкой. Использование команды select into. Вставка результата запроса.
презентация, добавлен 21.02.2016Проектирование базы данных, в которой хранятся сведения о клиентах гостиницы, имеющихся номерах, обслуживающем персонале и сервисе. Форма для добавления/изменения/удаления данных. Разработка и запуск форм редактирования данных, запросов и отчета.
курсовая работа, добавлен 01.12.2016Рассмотрение понятия и определения, структуры и функций системы управления базами данных. Их основные классификации. Создание компьютерной базы данных. Осуществление поиска в базе с помощью фильтров и запросов. Обработка данных и элементы управления.
контрольная работа, добавлен 24.04.2014Методика распределения центров сбора данных по центрам обработки данных для однотипных каналов связи и с использованием нескольких типов каналов связи применяемых в системах ЖКХ. Оценка положительного экономического эффекта от применения методики.
статья, добавлен 15.05.2017Анализ структур данных и алгоритмов ее обработки. Разработка алгоритмов программного средства. Выбор языка программирования. Программная реализация структур данных и алгоритма обработки. Оценка сложности алгоритма. Тестирование программного средства.
курсовая работа, добавлен 11.02.2021Системы управления базами данных (СУБД) как комплекс программ и языковых средств для создания, ведения и использования базы данных. Причины популярности СУБД. Форма и отчет в базе данных. План-конспект урока по теме "Обработка информации в СУБД".
курсовая работа, добавлен 30.07.2011Отображение или скрытие детальных данных сводной таблицы. Группировка и разгруппировка чисел и дат в сводной таблице, сортировка данных. Использование нескольких итоговых функций и дополнительных вычислений для поля данных таблицы, создание диаграммы.
лекция, добавлен 22.11.2010Понятие моделей данных. Схема иерархического дерева и пример сетевой структуры базы данных. Организация данных в виде двумерных таблиц в реляционной модели, их свойства. Проектирование реляционных баз данных и типы связей информационных объектов.
лекция, добавлен 13.08.2013Системы управления содержимым, которые обеспечивают доступ к информации в сети Internet и удобное редактирование базы данных. Получение информации о призывниках в режиме реального времени. Разработка алгоритма и описание работы программы обработки данных.
дипломная работа, добавлен 26.05.2018Характеристика главных концепций построения вычислительных систем. Анализ основных положений и определения методологии решения сложных задач. Изучение пакета прикладных программ MS Office, табличного хранения данных и подготовки текстовых документов.
курсовая работа, добавлен 28.10.2010