Исследование зависимости времени извлечения данных из XML-файлов от объема выборки файлов в условиях избыточности данных

Исследование и сравнительный анализ различных методов синтаксического анализа информации, хранящейся в XML-файлах. Анализ результатов тестирования методов парсинга на различных контрольных выборках документов, при разном объеме извлекаемых данных.

Подобные документы

  • Анализ деятельности библиотеки и методов ее автоматизации. Исследование и оценка программных продуктов системы управления базами данных. Выбор программного средства для разработки баз данных библиотечного фонда. Разработка запросов к таблицам баз данных.

    курсовая работа, добавлен 30.01.2017

  • Виды социологической информации. Обработка социологических данных с применением компьютеров и специализированных пакетов программ. Примеры применения различных программ для обработки текстовых данных. Связи между понятиями в текстовых полях базы данных.

    презентация, добавлен 09.10.2013

  • Характеристика базы данных как систематизированного набора записей и файлов, имеющих специальное предназначение. Изучение требований к организации компьютерной базы данных. Описание особенностей программы, предназначенной для создания баз данных – Ассess.

    отчет по практике, добавлен 26.03.2017

  • Формирование аналитических данных посредством выполнения операции очищения данных локальных баз организации, применения статистических методов и других сложных алгоритмов. Рассмотрение офисных приложений и систем интеллектуального анализа данных.

    реферат, добавлен 11.06.2015

  • Техники анализа большого количества постоянно прибывающей информации. Специфика больших данных. Традиционные методы работы с массивами информации. Программные инструменты для извлечения данных из внешних источников и обработки огромных массивов.

    реферат, добавлен 17.09.2014

  • Методы интеллектуального анализа данных, основанных на применении искусственных нейронных сетей, их ключевая особенность. Понятие репрезентативности исходных данных. Формирование обучающей выборки и оценка достоверности данных таблиц базы данных.

    статья, добавлен 30.05.2017

  • Информационно-аналитические системы как современный высокоэффективный инструмент принятия стратегических и оперативных решений. Анализ концепции построения интеллектуальной системы с выбором методов и средств анализа данных для обработки информации.

    статья, добавлен 01.02.2019

  • Определение файла как единицы хранения данных. Основные атрибуты, назначение и структура файлов. Отличительные черты текстовых и двоичных файлов. Роль видеопамяти в компьютере. Акселераторы и графические сопроцессоры. Средства для создания гипертекста.

    контрольная работа, добавлен 25.04.2013

  • Исследование методов и моделей оценки количества информации. Изучение основных форм ее представления и преобразования. Кодирование данных двоичным кодом. Единицы измерения данных. Десятичная позиционная система счисления. Кодирование текстовых данных.

    презентация, добавлен 31.10.2016

  • База данных как основа информационной системы. Объекты системы управления базами данных и их характеристика. Назначение программ-архиваторов, принцип их работы и методы сжимания файлов, их классификация и описание наиболее известных RAR, WinRAR и WinZip.

    контрольная работа, добавлен 06.02.2010

  • Анализ методов и технологий Data Mining. Применение искусственных нейронных сетей. Освоение среды Data Miner и разработка моделей анализа данных с применением программ STATISTICA. Анализ результатов применения моделей прогнозирования и анализа данных.

    дипломная работа, добавлен 14.12.2019

  • Анализ методов загрузки информации из хранилища источников в информационную систему приемника данных. Выбор инструмента извлечения данных и их преобразования перед загрузкой в место назначения. Реализация ETL-процесса на базе платформы 1С:Предприятие.

    статья, добавлен 18.01.2021

  • Исследование программирования на примере языка C++. Анализ методов и инструментов построения объектных моделей предметных областей. Разработка программного кода ввода исходных данных и вывода результатов. Характеристика создания справочной системы.

    курсовая работа, добавлен 18.06.2017

  • Программы, обеспечивающие работу с файлами данных. Функции системы управления базами данных. Проблемы сопровождения больших систем, основанных на файлах. Сетевые базы данных. Реляционная организация данных. Использование универсальных сред разработки.

    статья, добавлен 22.03.2019

  • Проектирование реляционных баз данных с использованием декомпозиционного и ER–методов. Вопросы поддержки целостности, защиты информации и параллельной обработки данных. Приложения для работы с базами данных с использованием СУБД Access и языка VBA.

    учебное пособие, добавлен 01.03.2011

  • Анализ работы различных систем управления базами данных MySQL, PgSQL, SqLite при большом количестве данных в одной таблице. Определение положительных и отрицательных аспектов работы баз данных. Разработка рекомендаций по улучшению их производительности.

    статья, добавлен 27.07.2017

  • Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.

    дипломная работа, добавлен 01.12.2019

  • Рассмотрение особенностей преобразования данных в сжатую (архивную) форму для долгосрочного хранения или передачи их по сети. Уменьшение размера файлов за счет удаления повторяющихся данных. Формирование таблиц, столбиковой и круговой диаграммы.

    контрольная работа, добавлен 04.03.2016

  • Классификация форматов графических файлов. Растровая графика и наиболее распространенные растровые форматы графических файлов. Использование GIF- и JPEG-формата. Преобразование файлов одного растрового формата в другой. Методы сжатия графических данных.

    реферат, добавлен 13.05.2015

  • Теоретическое представление об алгоритмах. Разработка программы в среде DELPHI "Анализ эффективности сжатия данных и архивирование", которая позволяет пользователям сжимать файлы выбранными архиваторами с выводом таблиц исходных и сжатых размеров файлов.

    статья, добавлен 29.06.2017

  • Анализ существующих методов сортировки, обоснование результатов тестирования рассматриваемого алгоритма, исследование приоритетов данного алгоритма и методов его реализации, разработка шаблонов функций C++, сортировка данных посредством простого выбора.

    курсовая работа, добавлен 13.06.2012

  • Характеристика основных методов организации данных во внешней памяти электронно-вычислительных машин. Изучение особенностей индексно-последовательного доступа. Характеристика назначения рабочих, промежуточных, служебных, архивных, основных файлов ЭВМ.

    статья, добавлен 11.03.2019

  • Классификация баз данных по модели представления данных и связи между ними, по организации хранения данных и обращения к ним, по типу хранимой информации. Избыточность информации, логическая и физическая независимость данных. Компоненты банка данных.

    презентация, добавлен 17.04.2013

  • Употребление инструментов, предоставляемых социальными сетями и мессенджерами, для построения системы анализа больших данных для поддержки работы образовательной организации. Применение методов обработки естественного языка (natural language processing).

    статья, добавлен 14.02.2022

  • База данных как организованная структура, предназначенная для хранения информации, которая представляются в виде взаимосвязанных файлов или таблиц, предназначенных для решения конкретной задачи. Алгоритм создания информационного запроса на выборку.

    курсовая работа, добавлен 18.03.2020

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.