Исследование зависимости времени извлечения данных из XML-файлов от объема выборки файлов в условиях избыточности данных

Исследование и сравнительный анализ различных методов синтаксического анализа информации, хранящейся в XML-файлах. Анализ результатов тестирования методов парсинга на различных контрольных выборках документов, при разном объеме извлекаемых данных.

Подобные документы

  • Концептуальная схема, её модели данных. Соотношение внутреннего и внешнего языка определения данных. Двухзвенная модель распределения функций в модели клиент/сервер. Выбор функции хеширования. Организация файлов в виде кучи. Основные реляционные операции.

    шпаргалка, добавлен 17.02.2022

  • Проблемы разработки графовых баз данных в условиях быстро растущего объема генерируемых и обрабатываемых данных. Анализ особенностей графовых моделей данных. Постановка задачи о разработке нового способа представления графов в памяти компьютера.

    статья, добавлен 29.07.2017

  • Плюсы и минусы файловых систем FAT и NTFS, анализ основных неисправностей жестких дисков, методы восстановления данных. Способы автоматического восстановления файлов с помощью специализированных утилит. Алгоритм редактирования служебной информации в MFT.

    дипломная работа, добавлен 26.05.2014

  • Изучение методов формирования тестового покрытия для базы данных, входящей в состав интегрированной информационной системы, основанного на априорном анализе рисков и модифицированной модели верификации базы данных для сокращения затрат на автоматизацию.

    статья, добавлен 23.02.2016

  • Рассмотрение вопроса создания специализированного приложения для разработки баз данных. Причины популярности электронных баз данных. Использование различных языков программирования для создания баз данных. Создание электронной базы данных деканата.

    статья, добавлен 21.01.2018

  • Исследование системы управления базами данных. Обзор поддержки программными средствами представления, соответствующего реальности. Изучение особенностей обработки, добавления, изменения, сортировки информации. Анализ концепций реляционной модели данных.

    курсовая работа, добавлен 23.05.2012

  • Анализ проблемы унификации справочной информации для внедрения различных систем класса АСУ ТОиР. Создание стартового массива данных для их запуска. Улучшение процесса поддержания обновления мастер-данных. Особенность использования внешних консультантов.

    статья, добавлен 18.02.2020

  • Основные аспекты обработки структур и файлов в среде C++Builder. Организация ввода/вывода значений комбинированных типов данных. Программирование задач с использованием структур и файлов в среде C++Builder. Проектирование интерфейса пользователя.

    курсовая работа, добавлен 23.11.2016

  • Организация выборки информации из базы данных. Основные пользователи базы данных "Университет". Характеристика работы с базой данных. Организация запросов, разработка базы данных из пяти таблиц и создание форм для удобного пользовательского интерфейса.

    курсовая работа, добавлен 22.12.2016

  • Проблема обработки данных в публичном доступе глобальной сети интернет. Способы извлечения информации из слабоструктурированных веб страниц. Программное обеспечение для автоматизации процесса извлечения информации из наукометрических баз данных.

    статья, добавлен 29.01.2016

  • Рассмотрены: записи, файлы и управление ими, основные задачи обработки и корректировки файлов, сравнительный анализ обработки структур типа "файл" и "запись" в языках программирования высокого уровня Си++ и Паскаль. Сделаны выводы по данным анализа.

    курсовая работа, добавлен 26.04.2014

  • Понятие архивных файлов и назначение программ-архиваторов. Работа с архивами. Пересылка файлов из архива и в архив. Извлечение файлов из архива и их удаление. Создание архива и методы архивирования. Типы архивных файлов. Перезапись файлов при распаковке.

    реферат, добавлен 15.04.2009

  • Инкапсулирование свойств и методов полей типами данных и способы использования объектов полей в наборе данных. Класс TFieid как основа использования полей в наборах данных. Типы данных, используемые при разработке приложений для работы с базами данных.

    лекция, добавлен 14.03.2014

  • Основные принципы построения и организации пакетных файлов и сценариев в среде ОС Windows XP. Понятие пакетных файлов, их расширение. Способы применения команды присвоения переменной среды Set, Echo, применения команды циклической обработки данных For.

    лабораторная работа, добавлен 30.11.2014

  • Распознавание параметров командной строки и обработка данных. Выбор четырех вариантов обработки данных. Запрос номера обрабатываемого файла. Построение гистограммы распределения. Смешивание, выравнивание, поиск и статистика как типы обработки данных.

    контрольная работа, добавлен 20.05.2015

  • Технологии и методы интеллектуального анализа данных. Этапы процесса интеллектуального анализа. Задачи, которые решает Data mining. Концепция методов кластерного анализа. Вещественно-значные, бинарные, номинальные, порядковые переменные и их значимость.

    статья, добавлен 28.01.2019

  • Современные методы стеганографического шифрования. Методы сокрытия информации в текстовых файлах, в аудио/видео файлах, методы сокрытия информации в графических файлах. Совмещение криптографии и стеганографии. Лексическое встраивание скрытой информации.

    статья, добавлен 07.01.2016

  • Подключение к базе данных Oracle при помощи утилиты SQL *Plus. Работа с основными командами SQL *Plus и совместное использование команд SQL *Plus и SQL. Использование командных файлов для автоматизации процесса решения задач при работе с базами данных.

    лабораторная работа, добавлен 14.05.2016

  • Анализ данных машинного кода компиляторов при выполнении сборки программы в различных режимах. Анализ особенностей машинного кода, генерируемого различными компиляторами для Windows и Linux в режимах Debug и Release, обзор уязвимости переполнения буфера.

    статья, добавлен 08.03.2019

  • Общее понятие данных. Процедуры обработки данных в зависимости от видов представления данных. Организационные формы использования информационных технологий при обработке данных. Особенности и технологический процесс обработки экономической информации.

    курсовая работа, добавлен 08.05.2014

  • Исследование и сравнительный анализ существующих подходов и моделей поиска данных и интеграции данных распределенных неоднородных информационных систем. Создание комплекса программ и моделей выполнения операций, разработка алгоритмов их реализации.

    автореферат, добавлен 25.07.2018

  • Особенность использования кластерного анализа в аппаратном обеспечении. Изучение основных видов кластеров. Формирование результатов поиска на основе группировки при поиске файлов и веб-сайтов. Проведение исследования интерфейса программы Statistica.

    статья, добавлен 31.03.2019

  • Особенность утраты конфиденциальных данных компании. Распространение различных злоупотреблений, связанных с использованием вычислительной техники. Способы обеспечения безопасности информации. Анализ предотвращения потери и утечки секретных сведений.

    статья, добавлен 22.03.2019

  • Сравнительный анализ различных технологий и решений в области контейнеризации. Повышение эффективности разработки, эксплуатации веб-краулеров за счет автоматизации процессов управления системой сбора данных, основывающейся на применении ПО типа "краулер".

    дипломная работа, добавлен 28.11.2019

  • Выбор источника и наборов открытых данных. Выбор социальных сетей для извлечения данных. Разработка формата хранения данных. Реализация сервиса агрегации открытых данных и данных из социальных сетей. Визуализация собранных данных методом теплой карты.

    дипломная работа, добавлен 25.06.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.