Классификация текстовых фрагментов слабоструктурированных текстовых документов как атрибут данных или как значение атрибута данных
Обоснование разработанного метода, позволяющего отнести тот или иной обособленный текстовый фрагмент слабоструктурированного текстового документа к атрибуту данных или к значению атрибута данных. Абсолютная встречаемость атомарных объектов в документах.
Подобные документы
Виды социологической информации. Обработка социологических данных с применением компьютеров и специализированных пакетов программ. Примеры применения различных программ для обработки текстовых данных. Связи между понятиями в текстовых полях базы данных.
презентация, добавлен 09.10.2013Основные подходы к сбору и обработке текстовых данных. Подходы к очистке табличных текстовых данных. Скрапинг веб-сайтов и работа с API. Реализация алгоритмов обработки данных ветеринарных сайтов. Сбор источников данных по рынку ветеринарных услуг Москвы.
дипломная работа, добавлен 07.12.2019Модель представления структуры и содержимого слабоструктурированных текстовых документов в виде совокупности объектов. Два типа объектов: атомарные объекты и объекты контейнеры, а также свойства и отношения, в которых они могут находиться между собой.
статья, добавлен 19.06.2018Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
дипломная работа, добавлен 30.06.2017Реляционная модель данных, ее элементы и формы представления. Основные понятия реляционного подхода (схема отношения, кортеж, сущность, атрибут, домен, значение атрибута, первичный ключ, тип данных) и их соотношение. Фундаментальные свойства отношений.
лекция, добавлен 07.01.2013Взаимосвязь таблиц как важнейший элемент реляционной модели данных. Выделение типов записей (отношений) баз данных, определение состава их атрибутов. Механизм, позволяющий любое отношение преобразовать к третьей нормальной форме; понятие атрибута.
статья, добавлен 11.03.2019Технологии интеграции распределенных данных на основе Extensible Markup Language. Ограничения нормализации: требование атомарности значений атрибута, запрет внутренней структуры. Пример фрагмента постреляционной базы данных, его достоинства и недостатки.
презентация, добавлен 21.02.2016Поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, как с коллекциями текстовых документов в научной области. Понятие онтологии, соотношение смыслов поиска и языковых слов, используемых в запросе.
статья, добавлен 10.05.2022Базовые понятия и общие представления о реляционной модели данных. Описание характеристик: типа данных, домена, атрибута, кортежа, первичного ключа отношения. Классификация и виды моделей данных - иерархическая, сетевая, реляционная и семантическая.
курсовая работа, добавлен 29.11.2014Использование CASE-средств при создании информационно-логической модели для документирования и проектирования баз данных. Анализ предметной области и изучение нормативных документов. Создание реляционной базы данных. Осуществление ввода текстовых данных.
курсовая работа, добавлен 27.02.2020Исследование методов и моделей оценки количества информации. Изучение основных форм ее представления и преобразования. Кодирование данных двоичным кодом. Единицы измерения данных. Десятичная позиционная система счисления. Кодирование текстовых данных.
презентация, добавлен 31.10.2016Проведение исследования основных признаков, характерных для баз данных. Проведение библиографического розыска и отбора документов для ввода в информационную модель. Порядок контроля и оценки программы. Анализ полнотекстового поиска в текстовых файлах.
контрольная работа, добавлен 20.08.2017Использование текстового редактора Word для создания комплексных текстовых документов. Расчеты и анализ данных с помощью табличного процессора Excel. Проектирование реляционных баз данных с помощью СУБД Access, разработка базы данных в Microsoft Excel.
курсовая работа, добавлен 02.02.2010Разработка математических моделей текстов на естественном языке предназначенных для поиска, классификации и кластеризации данных. Таксономическое представление текстовых документов в виде решетки замкнутых структурных синтактико-семантических описаний.
диссертация, добавлен 28.12.2016Общие сведения и обзор текстовых редакторов как самостоятельных компьютерных программ для создания и изменения текстовых данных. Проектирование приложения, читающего форматы doc и rtf; реализация его основных особенностей; интерфейс пользователя.
курсовая работа, добавлен 04.05.2014Понятие о текстовых базах данных и поисковом запросе документа по ключевым словам или терминам. Сущность и алгоритм построения инвертированного индекса. Возможности битово-матричного и сигнатурного индексирования, расширенного информационного поиска.
презентация, добавлен 11.10.2013Классификация систем подготовки текстовых документов. Описание возможностей различных текстовых редакторов и процессоров. Изучение особенностей процессов подготовки текстовых документов на примере Microsoft Word. Редактирование и форматирование текста.
реферат, добавлен 07.04.2014Построение информационных моделей предметных областей, понятие атрибута. Функциональные комплексы данных в виде не первой нормальной формы (NFNF). Факторы применения NFNF при разработке требований к методике построения информационной модели базы данных.
статья, добавлен 17.07.2018Особенности создания и оформления исходных таблиц, расчеты с применением "Мастера функций" и обработка данных посредством сортировки и выборки. Оформление отчета в виде комплексного текстового документа. Управление и графическое отображение данных.
контрольная работа, добавлен 14.01.2014Системы исчисления и двоичное представление информации в памяти компьютера. Процесс кодирования текстовых данных. Нахождение информационного объема сообщения. Представление целых чисел в вычислительной машине. Арифметические операции над величинами.
контрольная работа, добавлен 31.01.2014Понятие базы данных, особенности ее проектирования. Предыстория и развитие баз данных. Система управления базой данных (СУБД): классификация и взаимодействие с базой данных. Основные типы систем и модели баз данных, недостатки той или иной модели.
лекция, добавлен 14.08.2013Сущность и понятие баз данных. Классификация БД и их роль в информационной системе. Реляционные базы данных. Способ организации информации в различных видах баз данных. Особенности неструктурированных данных. Значение первичного ключа и типов полей.
презентация, добавлен 20.02.2018Понятие моделей данных. Схема иерархического дерева и пример сетевой структуры базы данных. Организация данных в виде двумерных таблиц в реляционной модели, их свойства. Проектирование реляционных баз данных и типы связей информационных объектов.
лекция, добавлен 13.08.2013Функциональный способ определения "данных пересечения" и взаимозаменяемость "слабых сущностей" и документов в моделях данных. Базовые классы структур и правила структуризации данных, содержащихся в документах. Особенности даталогического моделирования.
статья, добавлен 01.09.2018Задачи, сущность и классификация систем подготовки текстовых документов, возможности текстовых редакторов, текстовых процессоров и настольных издательских систем. Минимальный набор типовых операций в процессоре Microsoft Word при подготовке текста.
курсовая работа, добавлен 23.06.2015