Мониторинг качества данных с помощью Amazon Deequ

Использование библиотеки Amazon Deequ для мониторинга и оценки качества данных, разработанной на основе Apache Spark. Автоматическая проверка данных с помощью настраиваемых метрик: уникальность, полнота, консистентность. Диагностика проблем с данными.

Подобные документы

  • Языки создания сценариев, разработанные специально для Web. Система управления реляционными базами данных. Выбор компонентов для написания сайта системы электронной торговли. Разработка интернет-приложений, работающих с заранее созданной базой данных.

    контрольная работа, добавлен 14.03.2009

  • Понятие "база данных". Процесс проектирования таблиц с помощью СУБД Access, основные принципы при их построении. Инфологическая модель как главный этап в процессе их создания. Реляционная схема базы данных. Порядок создания запросов, их использование.

    курсовая работа, добавлен 25.11.2012

  • Создание с помощью приведенных операторов пример базы данных "Книжное дело". Определение структуры таблицы и связи между ними. Структура база данных. Запуск SQL Server Management Studio, проверка включения сервера. Создание таблицы Справочник поставщиков.

    лабораторная работа, добавлен 18.03.2021

  • Создание модели базы данных. Ввод данных в таблицу. Создание связей между таблицами. Разработка формы для ввода, просмотра и изменения данных в таблицах, а также для управления другими формами и отчетами. Создание отчета с помощью Мастера отчетов.

    курсовая работа, добавлен 27.10.2013

  • Характеристика структурно-функциональной модели автоматизированной системы мониторинга защиты данных, а также разработка математической модели определения категории персональных данных. Создание рекомендаций по усовершенствованию систем их защиты.

    статья, добавлен 27.05.2018

  • Обзоры существующих учебно-методических комплексов по информатике. Особенность формирования знаний, умений и навыков создания баз данных с помощью компьютера. Рассмотрение алгоритмических проблем, лежащих в основе методов поиска и обработки информации.

    статья, добавлен 18.07.2018

  • Исследование децентрализованной модели хранения и передачи данных, реализованной с помощью технологии блокчейн. Использование децентрализованной модели в платформах по телемедицине для обеспечения конфиденциальности и управления персональными данными.

    дипломная работа, добавлен 05.08.2018

  • Рассмотрение и анализ методов проактивного мониторинга дорожно-транспортной инфраструктуры на основе сбора и обработки больших данных о событиях на контролируемых участках дорог. Характеристика методов сбора, консолидации и обработки больших данных.

    статья, добавлен 02.01.2022

  • Понятие базы данных и системы управления базами данных. Классификация СУБД по характеру использования. Характеристика типов объектов. Создание запроса в режиме конструктора и с помощью мастера, вычисления в запросе. Компоненты среды СУБД, преимущества БД.

    реферат, добавлен 20.10.2015

  • Типы и организация хранения данных. Прагматическое назначение, понятие и элементы достоверности данных. Классификация и кодирование экономических данных. Понятие поиска данных. Операции манипулирования данными. Понятие и назначение модели данных.

    шпаргалка, добавлен 06.03.2011

  • Физические модели таблиц базы данных. Файловые структуры организации базы данных. Разрешение коллизии с помощью области переполнения, методом свободного замещения. Способы организации памяти для хранения данных. Назначение и функции программной системы.

    курсовая работа, добавлен 25.11.2013

  • Методика практической работы по созданию базы данных в режиме, состоящем из трех таблиц с помощью Мастера таблиц. Добавление и удаление записей, заполнение и редактирование таблиц, применение фильтра. Использование базы данных для практических задач.

    методичка, добавлен 08.04.2009

  • Создание непосредственно базы данных, а также средств управления данными. Типы входных данных. Создание таблиц баз данных с учетом нормализации, создание запросов и отчетов для получения выходных данных, необходимых для решения поставленных вопросов.

    курсовая работа, добавлен 27.02.2020

  • Основы по разработке баз данных. Разработка структуры базы данных с помощью Microsoft Access. Основные этапы разработки таблиц. Реляционная схема базы данных. Разработка пользовательского интерфейса и описание приложения. Проектирование запросов и форм.

    курсовая работа, добавлен 19.10.2015

  • Понятие базы данных и принципы её создания. Элементы базы данных учебных материалов и связи между объектами. Описание таблиц и связей между ними, схема создания и заполнения таблиц. Запросы к базе данных электронной библиотеки и обработка результатов.

    курсовая работа, добавлен 19.02.2013

  • Получение набора данных, в котором выбросы и экстремальные значения подвергнуты фильтрации с помощью фильтров. Выполнения спектральной обработки ряда для удаления шумов. Создание обучающей выборки с помощью скользящего окна. Оценка качества модели.

    контрольная работа, добавлен 01.03.2017

  • Разработка базы данных. Решение информационно-поисковых задач на основе массива строк. Решение информационно-поисковых задач на основе управления базами данных. Защита от несанкционированного доступа. Ограничение доступа к базе данных с помощью паролей.

    курсовая работа, добавлен 15.12.2016

  • Информация: понятие типы (первичная, обработанная), качества (актуальность, полнота, точность), уровни (оперативный, тактический, стратегический). Функции, обеспечивающие управление. Структурирование базы данных на примере приказа о зачислении студентов.

    презентация, добавлен 07.12.2013

  • Рассмотрение методов, способов и средств защиты информации. Рассмотрение процесса шифрования данных. Пояснение цели и основных способов несанкционированного вторжения в процесс обмена данными в IP сетях. Осуществление кодировки текста с помощью алфавита.

    реферат, добавлен 15.02.2010

  • Структура автоматизированной базы данных. Полное описание таблицы "Клиенты". Использование запросов как источников данных. Отчет — эффективное средство для организации распечатки итоговой информации. Отчет магазина по продажам радиодеталей за месяц.

    курсовая работа, добавлен 28.04.2014

  • Базы данных и системы управления базами данных. Режимы работы с ними. Свойства полей базы данных. Объекты базы данных: таблицы, запросы и формы. Разработка технического задания и структуры базы данных. Основные типы данных и безопасность баз данных.

    контрольная работа, добавлен 31.01.2011

  • Анализ данных при помощи визуализаторов. Прогнозирование с помощью линейной регрессии. Кластеризация с помощью самоорганизующейся карты Кохонена. Описание демо-примера программы Deductor. Характеристика многомерного кросс-платформенного хранилища данных.

    лабораторная работа, добавлен 20.10.2012

  • Проведение системного анализа и оценки свойств, принципов работы и основных характеристик методов сжатия данных, определение эффективных алгоритмов для уменьшения объема данных. Предназначение кодирования строковых данных и данных произвольного типа.

    статья, добавлен 29.01.2016

  • Характеристика концепции электронных хранилищ данных. Анализ информационно-документационного обеспечения библиотеки. Описание схемы хранилища данных "Библиотекарь", а также разработка возможности поиска в нем, форм вывода и представления данных.

    курсовая работа, добавлен 25.01.2017

  • Характеристика современных методов управления и контроля тестовых данных, выявление их преимуществ и недостатков. Описание проблемы управления тестовыми данными. Применение методов контроля тестовых данных при тестировании сложных информационных систем.

    статья, добавлен 07.11.2018

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.