Исследование зависимости времени извлечения данных из XML-файлов от объема выборки файлов в условиях избыточности данных
Исследование и сравнительный анализ различных методов синтаксического анализа информации, хранящейся в XML-файлах. Анализ результатов тестирования методов парсинга на различных контрольных выборках документов, при разном объеме извлекаемых данных.
Подобные документы
Анализ деятельности библиотеки и методов ее автоматизации. Исследование и оценка программных продуктов системы управления базами данных. Выбор программного средства для разработки баз данных библиотечного фонда. Разработка запросов к таблицам баз данных.
курсовая работа, добавлен 30.01.2017Виды социологической информации. Обработка социологических данных с применением компьютеров и специализированных пакетов программ. Примеры применения различных программ для обработки текстовых данных. Связи между понятиями в текстовых полях базы данных.
презентация, добавлен 09.10.2013Характеристика базы данных как систематизированного набора записей и файлов, имеющих специальное предназначение. Изучение требований к организации компьютерной базы данных. Описание особенностей программы, предназначенной для создания баз данных – Ассess.
отчет по практике, добавлен 26.03.2017Формирование аналитических данных посредством выполнения операции очищения данных локальных баз организации, применения статистических методов и других сложных алгоритмов. Рассмотрение офисных приложений и систем интеллектуального анализа данных.
реферат, добавлен 11.06.2015Техники анализа большого количества постоянно прибывающей информации. Специфика больших данных. Традиционные методы работы с массивами информации. Программные инструменты для извлечения данных из внешних источников и обработки огромных массивов.
реферат, добавлен 17.09.2014Методы интеллектуального анализа данных, основанных на применении искусственных нейронных сетей, их ключевая особенность. Понятие репрезентативности исходных данных. Формирование обучающей выборки и оценка достоверности данных таблиц базы данных.
статья, добавлен 30.05.2017Информационно-аналитические системы как современный высокоэффективный инструмент принятия стратегических и оперативных решений. Анализ концепции построения интеллектуальной системы с выбором методов и средств анализа данных для обработки информации.
статья, добавлен 01.02.2019Определение файла как единицы хранения данных. Основные атрибуты, назначение и структура файлов. Отличительные черты текстовых и двоичных файлов. Роль видеопамяти в компьютере. Акселераторы и графические сопроцессоры. Средства для создания гипертекста.
контрольная работа, добавлен 25.04.2013Исследование методов и моделей оценки количества информации. Изучение основных форм ее представления и преобразования. Кодирование данных двоичным кодом. Единицы измерения данных. Десятичная позиционная система счисления. Кодирование текстовых данных.
презентация, добавлен 31.10.2016База данных как основа информационной системы. Объекты системы управления базами данных и их характеристика. Назначение программ-архиваторов, принцип их работы и методы сжимания файлов, их классификация и описание наиболее известных RAR, WinRAR и WinZip.
контрольная работа, добавлен 06.02.2010- 61. Разработка моделей для прогнозирования и анализа данных с применением пакета программ STATISTICA
Анализ методов и технологий Data Mining. Применение искусственных нейронных сетей. Освоение среды Data Miner и разработка моделей анализа данных с применением программ STATISTICA. Анализ результатов применения моделей прогнозирования и анализа данных.
дипломная работа, добавлен 14.12.2019 Анализ методов загрузки информации из хранилища источников в информационную систему приемника данных. Выбор инструмента извлечения данных и их преобразования перед загрузкой в место назначения. Реализация ETL-процесса на базе платформы 1С:Предприятие.
статья, добавлен 18.01.2021Исследование программирования на примере языка C++. Анализ методов и инструментов построения объектных моделей предметных областей. Разработка программного кода ввода исходных данных и вывода результатов. Характеристика создания справочной системы.
курсовая работа, добавлен 18.06.2017Программы, обеспечивающие работу с файлами данных. Функции системы управления базами данных. Проблемы сопровождения больших систем, основанных на файлах. Сетевые базы данных. Реляционная организация данных. Использование универсальных сред разработки.
статья, добавлен 22.03.2019Проектирование реляционных баз данных с использованием декомпозиционного и ER–методов. Вопросы поддержки целостности, защиты информации и параллельной обработки данных. Приложения для работы с базами данных с использованием СУБД Access и языка VBA.
учебное пособие, добавлен 01.03.2011- 66. Анализ производительности систем управления базами данных при работе с большим объемом информации
Анализ работы различных систем управления базами данных MySQL, PgSQL, SqLite при большом количестве данных в одной таблице. Определение положительных и отрицательных аспектов работы баз данных. Разработка рекомендаций по улучшению их производительности.
статья, добавлен 27.07.2017 Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Рассмотрение особенностей преобразования данных в сжатую (архивную) форму для долгосрочного хранения или передачи их по сети. Уменьшение размера файлов за счет удаления повторяющихся данных. Формирование таблиц, столбиковой и круговой диаграммы.
контрольная работа, добавлен 04.03.2016Классификация форматов графических файлов. Растровая графика и наиболее распространенные растровые форматы графических файлов. Использование GIF- и JPEG-формата. Преобразование файлов одного растрового формата в другой. Методы сжатия графических данных.
реферат, добавлен 13.05.2015Теоретическое представление об алгоритмах. Разработка программы в среде DELPHI "Анализ эффективности сжатия данных и архивирование", которая позволяет пользователям сжимать файлы выбранными архиваторами с выводом таблиц исходных и сжатых размеров файлов.
статья, добавлен 29.06.2017- 71. Разработка и анализ алгоритма сортировки посредством выбора на основе разработки шаблона функции C++
Анализ существующих методов сортировки, обоснование результатов тестирования рассматриваемого алгоритма, исследование приоритетов данного алгоритма и методов его реализации, разработка шаблонов функций C++, сортировка данных посредством простого выбора.
курсовая работа, добавлен 13.06.2012 Характеристика основных методов организации данных во внешней памяти электронно-вычислительных машин. Изучение особенностей индексно-последовательного доступа. Характеристика назначения рабочих, промежуточных, служебных, архивных, основных файлов ЭВМ.
статья, добавлен 11.03.2019Классификация баз данных по модели представления данных и связи между ними, по организации хранения данных и обращения к ним, по типу хранимой информации. Избыточность информации, логическая и физическая независимость данных. Компоненты банка данных.
презентация, добавлен 17.04.2013- 74. Система извлечения и анализа текстовых данных из социальных сетей для образовательного учреждения
Употребление инструментов, предоставляемых социальными сетями и мессенджерами, для построения системы анализа больших данных для поддержки работы образовательной организации. Применение методов обработки естественного языка (natural language processing).
статья, добавлен 14.02.2022 База данных как организованная структура, предназначенная для хранения информации, которая представляются в виде взаимосвязанных файлов или таблиц, предназначенных для решения конкретной задачи. Алгоритм создания информационного запроса на выборку.
курсовая работа, добавлен 18.03.2020