Интеллектуальная кластеризация текстовых данных
Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
Подобные документы
Сравнение тематик (topics) и обзор специальных сессий двух конгрессов. Новое направление исследований – интеллектуальный анализ баз данных временных рядов (Data Mining for Time Series Data Base). Анализ основных работ по DM баз данных временных рядов.
статья, добавлен 09.09.2012Формирование аналитических данных посредством выполнения операции очищения данных локальных баз организации, применения статистических методов и других сложных алгоритмов. Рассмотрение офисных приложений и систем интеллектуального анализа данных.
реферат, добавлен 11.06.2015- 103. Система извлечения и анализа текстовых данных из социальных сетей для образовательного учреждения
Употребление инструментов, предоставляемых социальными сетями и мессенджерами, для построения системы анализа больших данных для поддержки работы образовательной организации. Применение методов обработки естественного языка (natural language processing).
статья, добавлен 14.02.2022 Исследуются процессы синхронизации, протекающие в осцилляторных сетях различной топологии. Оценка локальной и глобальной синхронизации осцилляторов в сети. Способы использования осцилляторных сетей при решении задач кластеризации N-мерных данных.
статья, добавлен 15.01.2019Основы MySQL. Даталогическая модель базы данных "Travel". Создание базы данных в программе phpMyAdmin. Создание таблиц баз данных. Работа с базой данных MySQL. Извлечение данных из базы данных. Обновление записей в базе данных. Поиск данных о туристе.
практическая работа, добавлен 17.06.2012Проведен анализ данных о реализованных угрозах путем кластеризации разными методами с различным количеством кластеров, для выявления результатов разделения угроз наилучшим образом. Основные последствия реализации угроз информационной безопасности.
статья, добавлен 03.04.2018Возможности текстовых процессоров, их функции и принципы использования. Обработка документов с текстом в текстовых редакторах Лексикон, Word Pad, WordPerfect, Microsoft Word 6.0 и Microsoft Word 2003. Пользовательский интерфейс. Вид окна и приемы работы.
реферат, добавлен 04.02.2009Приложения MS–Access как настольная система управления реляционными базами данных, предназначенных для работы на автономном ПК. Окно базы данных и создание таблиц. Ввод и редактирование данных. Обработка данных, содержащихся в таблице с помощью запросов.
контрольная работа, добавлен 19.11.2014Функциональный способ определения "данных пересечения" и взаимозаменяемость "слабых сущностей" и документов в моделях данных. Базовые классы структур и правила структуризации данных, содержащихся в документах. Особенности даталогического моделирования.
статья, добавлен 01.09.2018Обеспечение качества данных словарей, справочников и классификаторов. Анализ и систематизация основных методов структурирования информации. Создание специального математического и программного обеспечения для хранения информации в реляционной базе данных.
автореферат, добавлен 02.07.2018Особенность снижения доли повторно передающихся по каналу связей данных во время применения кэширования данных. Проведение исследования вероятности попадания запроса в кэш и коэффициент снижения требуемой пропускной способности канала передачи данных.
статья, добавлен 25.08.2020Предпосылки возникновения распределенных баз данных. Фрагментация данных. Удаленный доступ взаимодействия с базой данных. Архитектура моделей удалённого доступа. Параллельные процессы (или процесс транзакций). Безопасность данных. Хранилище данных.
учебное пособие, добавлен 08.10.2017Принципы кодирования информации в персональных компьютерах. Характеристика распространенных систем кодировки для представления текстовых данных, растровых и векторных изображений, а также звуковой информации. Особенности форматов кодирования видеоданных.
реферат, добавлен 11.12.2013Анализ проблем, связанных с доставкой мультимедийных данных сразу нескольким пользователям. Описание экспериментальных систем, которые умеют выбирать из базы данных графические образы на основе таких нечетких характеристик, как цвет, форма, текстура.
статья, добавлен 05.04.2019- 115. Базы и банки данных
Классификация баз данных по модели представления данных и связи между ними, по организации хранения данных и обращения к ним, по типу хранимой информации. Избыточность информации, логическая и физическая независимость данных. Компоненты банка данных.
презентация, добавлен 17.04.2013 Сущность и понятие баз данных. Классификация БД и их роль в информационной системе. Реляционные базы данных. Способ организации информации в различных видах баз данных. Особенности неструктурированных данных. Значение первичного ключа и типов полей.
презентация, добавлен 20.02.2018Понятие о базе данных и системах управления базами данных. Сетевые, реляционные и объектно-ориентированные модели. Системы управления базами – персональные, многопользовательские. Функции: определение и обработка, безопасность и восстановление данных.
реферат, добавлен 10.11.2008Описание технологии обработки текстовых, графических и табличных данных. Характеристика гипертекстовой технологии представления информации. Мультимедиа – интерактивная технология, обеспечивающая работу с неподвижными изображениями, текстом и звуком.
реферат, добавлен 16.03.2014Классификация основных типов и механизмов репликации данных. Распределение, использующее двухфазную фиксацию. Анализ и характеристика существующих технических решений, выбор системы управления базами данных. Создание и настройка подчиненного сервера.
дипломная работа, добавлен 14.12.2019Сущность и определение понятия интеллектуального анализа данных. Технологии data mining как инструмент для решения сложных аналитических задач. Типы выявляемых закономерностей в системе. Области применения технологий интеллектуального анализа данных.
лекция, добавлен 26.08.2010Особенности создания, редактирования и хранения баз данных в среде Microsoft Exсel. Варианты реализации запросов в M Access. Принципы проектирования базы данных о телевизионных передачах, с группировкой по жанрам и подсчетом общего времени трансляции.
курсовая работа, добавлен 13.04.2015Результаты обработки поведенческих данных пользователей информационно-образовательного пространства университета. Особенности работы с поведенческими данными, обработка данных для последующего анализа, выделение поведенческих паттернов обучающегося.
статья, добавлен 17.08.2018Разработка и реализация базы данных карточек студентов. Работа с языком SQL. Анализ предметной области. Перечень хранимой информации: таблицы, поля, типы. Выделение справочных и оперативных данных. Создание и запуск базовых и продвинутых запросов SQL.
курсовая работа, добавлен 17.11.2017- 124. Формирование графических и описательных (атрибутивных) данных при подготовке материалов кадастра
Формирование базы данных на основные объекты земельного кадастра (здания и земельные участки) и их векторизация. Заполнение базы данных при использовании SQL-запросов. Формирование пространственных запросов. Порядок кадастрового деления территории РФ.
курсовая работа, добавлен 29.06.2012 - 125. Хранилище данных
Сущность, состав и значения хранилища данных, определения требований к данным. Способы хранения данных и наборы их возможностей. Типичная структура хранилищ данных, таблица фактов. Создание информационно-аналитических систем, анализ области их применения.
курсовая работа, добавлен 01.10.2009