Интеллектуальная кластеризация текстовых данных
Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
Подобные документы
Приложения MS–Access как настольная система управления реляционными базами данных, предназначенных для работы на автономном ПК. Окно базы данных и создание таблиц. Ввод и редактирование данных. Обработка данных, содержащихся в таблице с помощью запросов.
контрольная работа, добавлен 19.11.2014Обеспечение качества данных словарей, справочников и классификаторов. Анализ и систематизация основных методов структурирования информации. Создание специального математического и программного обеспечения для хранения информации в реляционной базе данных.
автореферат, добавлен 02.07.2018Функциональный способ определения "данных пересечения" и взаимозаменяемость "слабых сущностей" и документов в моделях данных. Базовые классы структур и правила структуризации данных, содержащихся в документах. Особенности даталогического моделирования.
статья, добавлен 01.09.2018Особенность снижения доли повторно передающихся по каналу связей данных во время применения кэширования данных. Проведение исследования вероятности попадания запроса в кэш и коэффициент снижения требуемой пропускной способности канала передачи данных.
статья, добавлен 25.08.2020Предпосылки возникновения распределенных баз данных. Фрагментация данных. Удаленный доступ взаимодействия с базой данных. Архитектура моделей удалённого доступа. Параллельные процессы (или процесс транзакций). Безопасность данных. Хранилище данных.
учебное пособие, добавлен 08.10.2017Принципы кодирования информации в персональных компьютерах. Характеристика распространенных систем кодировки для представления текстовых данных, растровых и векторных изображений, а также звуковой информации. Особенности форматов кодирования видеоданных.
реферат, добавлен 11.12.2013Анализ проблем, связанных с доставкой мультимедийных данных сразу нескольким пользователям. Описание экспериментальных систем, которые умеют выбирать из базы данных графические образы на основе таких нечетких характеристик, как цвет, форма, текстура.
статья, добавлен 05.04.2019- 108. Базы и банки данных
Классификация баз данных по модели представления данных и связи между ними, по организации хранения данных и обращения к ним, по типу хранимой информации. Избыточность информации, логическая и физическая независимость данных. Компоненты банка данных.
презентация, добавлен 17.04.2013 Сущность и понятие баз данных. Классификация БД и их роль в информационной системе. Реляционные базы данных. Способ организации информации в различных видах баз данных. Особенности неструктурированных данных. Значение первичного ключа и типов полей.
презентация, добавлен 20.02.2018Понятие о базе данных и системах управления базами данных. Сетевые, реляционные и объектно-ориентированные модели. Системы управления базами – персональные, многопользовательские. Функции: определение и обработка, безопасность и восстановление данных.
реферат, добавлен 10.11.2008Описание технологии обработки текстовых, графических и табличных данных. Характеристика гипертекстовой технологии представления информации. Мультимедиа – интерактивная технология, обеспечивающая работу с неподвижными изображениями, текстом и звуком.
реферат, добавлен 16.03.2014Классификация основных типов и механизмов репликации данных. Распределение, использующее двухфазную фиксацию. Анализ и характеристика существующих технических решений, выбор системы управления базами данных. Создание и настройка подчиненного сервера.
дипломная работа, добавлен 14.12.2019Сущность и определение понятия интеллектуального анализа данных. Технологии data mining как инструмент для решения сложных аналитических задач. Типы выявляемых закономерностей в системе. Области применения технологий интеллектуального анализа данных.
лекция, добавлен 26.08.2010Особенности создания, редактирования и хранения баз данных в среде Microsoft Exсel. Варианты реализации запросов в M Access. Принципы проектирования базы данных о телевизионных передачах, с группировкой по жанрам и подсчетом общего времени трансляции.
курсовая работа, добавлен 13.04.2015Результаты обработки поведенческих данных пользователей информационно-образовательного пространства университета. Особенности работы с поведенческими данными, обработка данных для последующего анализа, выделение поведенческих паттернов обучающегося.
статья, добавлен 17.08.2018Разработка и реализация базы данных карточек студентов. Работа с языком SQL. Анализ предметной области. Перечень хранимой информации: таблицы, поля, типы. Выделение справочных и оперативных данных. Создание и запуск базовых и продвинутых запросов SQL.
курсовая работа, добавлен 17.11.2017- 117. Формирование графических и описательных (атрибутивных) данных при подготовке материалов кадастра
Формирование базы данных на основные объекты земельного кадастра (здания и земельные участки) и их векторизация. Заполнение базы данных при использовании SQL-запросов. Формирование пространственных запросов. Порядок кадастрового деления территории РФ.
курсовая работа, добавлен 29.06.2012 - 118. Хранилище данных
Сущность, состав и значения хранилища данных, определения требований к данным. Способы хранения данных и наборы их возможностей. Типичная структура хранилищ данных, таблица фактов. Создание информационно-аналитических систем, анализ области их применения.
курсовая работа, добавлен 01.10.2009 Описан состав и функциональные возможности компьютерных систем подготовки текстовых документов, их редактирование и форматирование. Использование пользовательских и системных шаблонов, стилей, методов ввода и языка, установка параметров абзацев и пр.
реферат, добавлен 09.04.2014Особенности технологий аналитической обработки данных, а именно OLAP и ИАД (интеллектуального анализа данных), а также их интеграция. Применение данных методов работы с разнородной информацией больших объемов, методы хранения и работы с большими данными.
статья, добавлен 27.02.2019Представление реляционной базы данных как совокупности таблиц. Выбор языка SQL, создание реляционной базы данных. Обработка транзакций. Проектирование необходимых полей БД, их структура, тип, связи между объектами. Безопасность и санкционирование доступа.
курсовая работа, добавлен 09.12.2014Ведение бухгалтерского учета с использованием табличного процессора Excel. Алгоритм ввода и форматирования текстовых и числовых данных. Оформление таблицы и копирование данных на лист. Расчет заработной платы, больничных листов, налогов и удержаний.
контрольная работа, добавлен 17.05.2017- 123. Базы данных
Характеристика и сущность баз данных. Типы данных: текстовые, числовые, денежные, логические. Актуальные проблемы безопасности баз данных. Характеристика объектов баз данных: запросы, формы, отчеты, страницы. Основные особенности структуры базы данных.
реферат, добавлен 20.01.2012 Характеристика основных способов сжатия информации. Группы алгоритмов обратимого сжатия данных. Основная идея алгоритма Лемпеля-Зива. Особенности алгоритма LZ77 и LZ78. Модификации алгоритма, предложенные Т. Уэлчем. Основы процесса распаковки данных.
реферат, добавлен 15.10.2016Приобретение навыков в создании баз данных и использование технологии АDO. Отображение данных таблицы БД. Использование визуальных компонентов. Работа с данными графического типа. Создание вычисляемых полей. Фильтрация, сортировка и поиск данных.
методичка, добавлен 24.06.2014