Мониторинг качества данных с помощью Amazon Deequ

Использование библиотеки Amazon Deequ для мониторинга и оценки качества данных, разработанной на основе Apache Spark. Автоматическая проверка данных с помощью настраиваемых метрик: уникальность, полнота, консистентность. Диагностика проблем с данными.

Подобные документы

  • СУБД IDMS как типичный представитель систем, основанных на сетевой модели данных. Структура сетевых данных. Формирование типов связи. Примерный набор операций манипулирования данными. Ограничения целостности данных. Пример схемы сетевой базы данных.

    презентация, добавлен 04.05.2012

  • Понятие и состав информационной системы. Реляционные, сетевые, иерархические базы данных, их рабочие характеристики. Основные компоненты, функции и виды СУБД. Механизмы доступа и показатели качества баз данных. Направления исследований и разработок СУБД.

    курсовая работа, добавлен 15.02.2010

  • Инфологическая и даталогическая модели базы данных. Стратегия резервного копирование и восстановления. Функции, которые обеспечивает язык запросов SQL. Создание структуры базы данных. Ускорение поиска необходимых данных с помощью индексирования.

    курсовая работа, добавлен 02.10.2013

  • Отбор данных, удовлетворяющих условиям запросов. Представление в виде отчетов в MS Access результатов обработки данных. Создание элементов пользовательского интерфейса с помощью макросов. Руководство для пользователя по применению реляционной базы данных.

    курсовая работа, добавлен 15.08.2009

  • Проблема повышения производительности подсистемы кэш-памяти систем хранения данных. Аналитическое моделирование алгоритмов обработки данных с помощью метода Марковских цепей. Использование хеш-таблицы для построения управляющих индексных таблиц.

    статья, добавлен 07.03.2019

  • Построение сети передачи данных с помощью протокола маршрутизации OSPF. Разработка алгоритмов, позволяющих обрабатывать информацию, представленную с помощью графа. Их использование для нахождения минимального остовного дерева и поиска кратчайших путей.

    дипломная работа, добавлен 25.09.2014

  • Разработка с помощью ERwin логической и физической модели данных для проектируемой базы данных. Формирование соответствующего файла в формате Access. SQL-сценарий, который позволяет сгенерировать базу данных в формате MS SQL Server. Создание протокола.

    контрольная работа, добавлен 12.11.2013

  • Понятие базы данных и системы управления базой данных. Язык описания данных и манипулирования данными. Составляющие основы корпоративных многопользовательских баз данных – технология клиент-сервер и Internet-технология. Создание запросов, отчетов, форм.

    реферат, добавлен 29.01.2014

  • Рассмотрение процесса создания таблиц в режиме конструктор. Определение техники создания формы с помощью мастера и конструктора. Характеристика методики ввода данных в форму. Оценка способов работы с базой данных. Создание запросов с помощью мастера.

    реферат, добавлен 22.01.2016

  • Понятие и методы управления базами данных. Системы, основанные на инвертированных списках, иерархические и сетевые СУБД, их сильные места и недостатки. Реляционная база данных. Порядок создания модели данных с помощью ERWin, типы сущностей и их анализ.

    курс лекций, добавлен 07.01.2013

  • Основные идеи современной информационной технологии. Создание базы данных в СУБД ACCESS. Разработка технического задания и структуры базы данных. Описание ER-модели. Увеличение объема и структурной сложности хранимых данных. Язык манипулирования данными.

    курсовая работа, добавлен 08.02.2011

  • Система Access как набор инструментов конечного пользователя для управления базами данных. Создание баз данных и ввод данных с помощью мастера. Особенности создания таблицы в окне конструктора. Понятие "запрос по образцу", добавление поля в бланк запроса.

    курсовая работа, добавлен 20.03.2014

  • Особенность создания новой базы данных с помощью мастера. Исследование окна Management Studio. Изучение настроек файла данных и журнала транзакций. Отсоединение базы данных в MS SQL Server. Характеристика создания нового запроса на панели инструментов.

    лабораторная работа, добавлен 19.02.2021

  • Функции, выполняемые информационной технологией. Система управления базами данных Access. Создание макроса с помощью макрорекордера. Форматирование данных и построение диаграмм. Табличный процессор Excel. Создание, заполнение таблиц с помощью формы.

    контрольная работа, добавлен 08.10.2013

  • Совокупность баз данных, а также программные, языковые и другие средства, предназначенные для централизованного накопления данных и их использования с помощью электронных вычислительных машин. Проверка работоспособности компонентов (каналов, терминалов).

    реферат, добавлен 27.12.2015

  • Совокупность баз данных и систем управления базами данных. Система управления базами данных Мicrosoft Ассеss. Способы создания базы данных и создание новой пустой таблицы. Работа с данными при помощи запросов. Вычисляемые поля и итоговые запросы.

    курсовая работа, добавлен 24.11.2018

  • Механизмы обмена массивами данных между клиентом и сервером с помощью сети Интернет в условиях увеличения объема обрабатываемой информации. Методы решения проблем связанных с отказоустойчивостью и масштабируемостью при двухзвенной сетевой архитектуре.

    статья, добавлен 28.05.2017

  • Универсальная система кодирования текстовых данных. Методы кодирования звуковой информации двоичным кодом. Кодирование графических данных. Кодирование целых, действительных чисел. Установление наличия свободного пространства и проверка качества дисков ПК.

    контрольная работа, добавлен 25.10.2011

  • Рассмотрение понятия информационного ресурса, как необходимого компонента для обеспечения эффективной управленческой деятельности. Ознакомление с ключевыми компонентами программной системы поддержки принятия решений. Анализ работы системы мониторинга.

    статья, добавлен 11.07.2018

  • Характеристика технологий в области построения информационно-аналитических систем. Разработка программного комплекса, предназначенного проектировать модель данных и осуществлять контроль качества данных при построении информационно-аналитических систем.

    автореферат, добавлен 29.08.2018

  • Языки определения данных и манипулирования данными. Способы выражения запросов: процедурный и форм-ориентированный. Внутренний язык системы управления базами данных для работы с данными. Описательный язык определения данных Data Definition Language.

    презентация, добавлен 21.02.2016

  • Характеристика программного обеспечения, используемого при создании систем управления базами данных. Принципы организации данных, лежащие в основе современных систем управления базами данных. Современные технологии, используемые в работе с данными.

    реферат, добавлен 20.02.2015

  • Обеспечение качества данных словарей, справочников и классификаторов. Анализ и систематизация основных методов структурирования информации. Создание специального математического и программного обеспечения для хранения информации в реляционной базе данных.

    автореферат, добавлен 02.07.2018

  • Характеристика понятия и сущности, особенностей построения структуры данных. Табличные структуры (таблицы данных, матрицы данных). Пример таблицы, с помощью которой может быть организован учет учащихся. Расчет размеров отчислений с заработной платы.

    курсовая работа, добавлен 16.10.2017

  • Разработка базы данных для автоматизации работы с данными, предоставляющей пользователю информацию о винчестерах и более современных накопителях информации. Использование Microsoft Access как функциональной реляционной системы управления базами данных.

    курсовая работа, добавлен 29.03.2019

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.