Предварительная обработка данных с помощью библиотеки Pandas
Функциональные возможности Pandas для очистки и преобразования данных о продажах компании, содержащих дубликаты строк, неправильные типы данных, пропуски и отрицательные значения в форму, пригодную для дальнейшего анализа. Загрузка данных в библиотеку.
Подобные документы
- 26. Базы данных
Характеристика и сущность баз данных. Типы данных: текстовые, числовые, денежные, логические. Актуальные проблемы безопасности баз данных. Характеристика объектов баз данных: запросы, формы, отчеты, страницы. Основные особенности структуры базы данных.
реферат, добавлен 20.01.2012 Анализ предметной области, выбор системы управления базами данных. Преобразование ER-диаграммы в базу данных. Составление реляционных отношений. Схема реляционной базы данных. Реализация проекта базы данных для страховой компании.
курсовая работа, добавлен 22.05.2016Понятия базы, записи, поля данных, системы управления. Основные особенности Microsoft Access, ее функциональные возможности. Характеристика сферы применения "настольных" СУБД. Создание баз данных в EXCEL. Поиск данных с помощью средства автофильтра.
курсовая работа, добавлен 25.04.2013Приложения MS–Access как настольная система управления реляционными базами данных, предназначенных для работы на автономном ПК. Окно базы данных и создание таблиц. Ввод и редактирование данных. Обработка данных, содержащихся в таблице с помощью запросов.
контрольная работа, добавлен 19.11.2014Распределенная обработка данных: понятие, пример эволюции. Обработка данных по принципу треугольника. Назначение локальных баз и банков данных организации. Краткая характеристика основных идеологий: клиент-сервер, web и распределенные объекты (DCOM).
контрольная работа, добавлен 21.05.2013- 31. Базы данных
Компьютерная обработка информации. Иерархическая, сетевая и реляционная модели данных. Структура базы данных. Поля баз данных. Средства, обеспечивающие многопользовательскую работу. Область применения баз данных. Защита от несанкционированного доступа.
курсовая работа, добавлен 22.04.2014 Состав архитектуры современной информационно-аналитической системы. Сбор и первичная обработка данных. Извлечение, преобразование и загрузка данных. Реляционные и многомерные витрины, их отличие от транзакционных баз данных. Реализация Web-портала.
контрольная работа, добавлен 19.05.2013Получения данных пользователя с помощью API Вконтакте. Визуализация обработанных данных, построение графов. Описание алгоритма обработки данных. Рассмотрение библиотеки NetworkX для создания, манипуляции и изучения структуры сложных сетевых структур.
курсовая работа, добавлен 11.01.2020Технология и классификация баз данных, виды моделей данных. Основные элементы базы данных в среде системы управления базами данных Access 2003, объекты, типы и свойства полей базы данных. Создание базы данных с основными и вспомогательными таблицами.
курсовая работа, добавлен 21.10.2014Рассмотрение особенностей преобразования данных в сжатую (архивную) форму для долгосрочного хранения или передачи их по сети. Уменьшение размера файлов за счет удаления повторяющихся данных. Формирование таблиц, столбиковой и круговой диаграммы.
контрольная работа, добавлен 04.03.2016- 36. Базы данных
Хранение и обработка больших объемов информации. Понятие информационной системы. Виды структур данных. Виды баз данных. Состав и функции систем управления базами данных. Справочные ограничения целостности. Сетевая структура и организация данных.
реферат, добавлен 13.03.2013 Ознакомление с программами, с помощью которых пользователи работают с базой данных. Рассмотрение трехуровневой системы организации баз данных, предложенной ANSI. Процесс прохождения пользовательского запроса в базе данных. Классификация моделей данных.
презентация, добавлен 09.07.2015Понятие базы данных, ее проектирование и определение цели создания. Добавление данных и создание других объектов базы данных. Особенности использования средств анализа в Microsoft Access. Основные инструменты создания базы данных с помощью мастера.
реферат, добавлен 15.06.2013- 39. Хранилище данных
Сущность, состав и значения хранилища данных, определения требований к данным. Способы хранения данных и наборы их возможностей. Типичная структура хранилищ данных, таблица фактов. Создание информационно-аналитических систем, анализ области их применения.
курсовая работа, добавлен 01.10.2009 Разработка и проектирование базы данных библиотеки. Создание интерфейса пользователя в среде программирования "1С: Предприятие". Описание автоматизированного рабочего места в библиотеке. Листинг программной реализации базы данных для библиотеки.
курсовая работа, добавлен 01.06.2015Основные элементы концепции хранилищ данных. Архитектуры глобальных хранилищ данных. Взаимосвязанные и независимые магазины данных. Анализ методов повышения эффективности алгоритмов обработки хранимых данных в связи с валообразным увеличением их объема.
статья, добавлен 15.08.2020Понятие информации, данных и правила их смысловой интерпретации. Архитектура и основные компоненты банка данных: датологическое представление информационной модели ПО и система управления базой данных. Классификация моделей данных, их характеристика.
реферат, добавлен 11.07.2011Способы представления и редактирования полученных данных приложениями баз данных. Иерархия классов, обеспечивающих функционирование набора данных. Параметры запросов и хранимых процедур. Возможности автоматического состояния и изменения набора данных.
лекция, добавлен 14.03.2014Возможность применения машинного обучения при классификации спама. Структура файла "spam". Программный код использования библиотеки pandas, перевода категориальных признаков в числовые. Код тестирования различного количества нейронов, его анализ.
статья, добавлен 17.02.2019Способы и этапы реализации базы данных для библиотеки: этап системного анализа предметной области, инфологического моделирования, даталогического проектирования, физического моделирования, реализации базы данных, а также создания интерфейса приложения.
курсовая работа, добавлен 11.03.2011Понятие и методы управления базами данных. Системы, основанные на инвертированных списках, иерархические и сетевые СУБД, их сильные места и недостатки. Реляционная база данных. Порядок создания модели данных с помощью ERWin, типы сущностей и их анализ.
курс лекций, добавлен 07.01.2013Понятие базы данных как организованной совокупности данных, предназначенной для длительного хранения во внешней памяти компьютера. Основные типы организации данных и связей между ними. Системы управления базами данных, особенности их классификации.
презентация, добавлен 22.05.2016Понятие банка данных, базы данных и СУБД. Логическое представление и система управления базами данных, ее функции: определение, обработка, безопасность, целостность и введение словаря данных. Модели, поддерживаемые СУБД. Области применения БД в экономике.
контрольная работа, добавлен 03.12.2013Создание таблиц в базе данных Access, их корректировка. Связь между таблицами с помощью общих полей. Создание форм для просмотра таблиц с использованием Мастер форм. Значения полей, основные типы данных и их описания. Сохранение новой базы данных.
контрольная работа, добавлен 27.10.2013Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
дипломная работа, добавлен 30.06.2017