Предварительная обработка данных с помощью библиотеки Pandas

Функциональные возможности Pandas для очистки и преобразования данных о продажах компании, содержащих дубликаты строк, неправильные типы данных, пропуски и отрицательные значения в форму, пригодную для дальнейшего анализа. Загрузка данных в библиотеку.

Подобные документы

  • Характеристика и сущность баз данных. Типы данных: текстовые, числовые, денежные, логические. Актуальные проблемы безопасности баз данных. Характеристика объектов баз данных: запросы, формы, отчеты, страницы. Основные особенности структуры базы данных.

    реферат, добавлен 20.01.2012

  • Анализ предметной области, выбор системы управления базами данных. Преобразование ER-диаграммы в базу данных. Составление реляционных отношений. Схема реляционной базы данных. Реализация проекта базы данных для страховой компании.

    курсовая работа, добавлен 22.05.2016

  • Понятия базы, записи, поля данных, системы управления. Основные особенности Microsoft Access, ее функциональные возможности. Характеристика сферы применения "настольных" СУБД. Создание баз данных в EXCEL. Поиск данных с помощью средства автофильтра.

    курсовая работа, добавлен 25.04.2013

  • Приложения MS–Access как настольная система управления реляционными базами данных, предназначенных для работы на автономном ПК. Окно базы данных и создание таблиц. Ввод и редактирование данных. Обработка данных, содержащихся в таблице с помощью запросов.

    контрольная работа, добавлен 19.11.2014

  • Распределенная обработка данных: понятие, пример эволюции. Обработка данных по принципу треугольника. Назначение локальных баз и банков данных организации. Краткая характеристика основных идеологий: клиент-сервер, web и распределенные объекты (DCOM).

    контрольная работа, добавлен 21.05.2013

  • Компьютерная обработка информации. Иерархическая, сетевая и реляционная модели данных. Структура базы данных. Поля баз данных. Средства, обеспечивающие многопользовательскую работу. Область применения баз данных. Защита от несанкционированного доступа.

    курсовая работа, добавлен 22.04.2014

  • Состав архитектуры современной информационно-аналитической системы. Сбор и первичная обработка данных. Извлечение, преобразование и загрузка данных. Реляционные и многомерные витрины, их отличие от транзакционных баз данных. Реализация Web-портала.

    контрольная работа, добавлен 19.05.2013

  • Получения данных пользователя с помощью API Вконтакте. Визуализация обработанных данных, построение графов. Описание алгоритма обработки данных. Рассмотрение библиотеки NetworkX для создания, манипуляции и изучения структуры сложных сетевых структур.

    курсовая работа, добавлен 11.01.2020

  • Технология и классификация баз данных, виды моделей данных. Основные элементы базы данных в среде системы управления базами данных Access 2003, объекты, типы и свойства полей базы данных. Создание базы данных с основными и вспомогательными таблицами.

    курсовая работа, добавлен 21.10.2014

  • Рассмотрение особенностей преобразования данных в сжатую (архивную) форму для долгосрочного хранения или передачи их по сети. Уменьшение размера файлов за счет удаления повторяющихся данных. Формирование таблиц, столбиковой и круговой диаграммы.

    контрольная работа, добавлен 04.03.2016

  • Хранение и обработка больших объемов информации. Понятие информационной системы. Виды структур данных. Виды баз данных. Состав и функции систем управления базами данных. Справочные ограничения целостности. Сетевая структура и организация данных.

    реферат, добавлен 13.03.2013

  • Ознакомление с программами, с помощью которых пользователи работают с базой данных. Рассмотрение трехуровневой системы организации баз данных, предложенной ANSI. Процесс прохождения пользовательского запроса в базе данных. Классификация моделей данных.

    презентация, добавлен 09.07.2015

  • Понятие базы данных, ее проектирование и определение цели создания. Добавление данных и создание других объектов базы данных. Особенности использования средств анализа в Microsoft Access. Основные инструменты создания базы данных с помощью мастера.

    реферат, добавлен 15.06.2013

  • Сущность, состав и значения хранилища данных, определения требований к данным. Способы хранения данных и наборы их возможностей. Типичная структура хранилищ данных, таблица фактов. Создание информационно-аналитических систем, анализ области их применения.

    курсовая работа, добавлен 01.10.2009

  • Разработка и проектирование базы данных библиотеки. Создание интерфейса пользователя в среде программирования "1С: Предприятие". Описание автоматизированного рабочего места в библиотеке. Листинг программной реализации базы данных для библиотеки.

    курсовая работа, добавлен 01.06.2015

  • Основные элементы концепции хранилищ данных. Архитектуры глобальных хранилищ данных. Взаимосвязанные и независимые магазины данных. Анализ методов повышения эффективности алгоритмов обработки хранимых данных в связи с валообразным увеличением их объема.

    статья, добавлен 15.08.2020

  • Понятие информации, данных и правила их смысловой интерпретации. Архитектура и основные компоненты банка данных: датологическое представление информационной модели ПО и система управления базой данных. Классификация моделей данных, их характеристика.

    реферат, добавлен 11.07.2011

  • Способы представления и редактирования полученных данных приложениями баз данных. Иерархия классов, обеспечивающих функционирование набора данных. Параметры запросов и хранимых процедур. Возможности автоматического состояния и изменения набора данных.

    лекция, добавлен 14.03.2014

  • Возможность применения машинного обучения при классификации спама. Структура файла "spam". Программный код использования библиотеки pandas, перевода категориальных признаков в числовые. Код тестирования различного количества нейронов, его анализ.

    статья, добавлен 17.02.2019

  • Способы и этапы реализации базы данных для библиотеки: этап системного анализа предметной области, инфологического моделирования, даталогического проектирования, физического моделирования, реализации базы данных, а также создания интерфейса приложения.

    курсовая работа, добавлен 11.03.2011

  • Понятие и методы управления базами данных. Системы, основанные на инвертированных списках, иерархические и сетевые СУБД, их сильные места и недостатки. Реляционная база данных. Порядок создания модели данных с помощью ERWin, типы сущностей и их анализ.

    курс лекций, добавлен 07.01.2013

  • Понятие базы данных как организованной совокупности данных, предназначенной для длительного хранения во внешней памяти компьютера. Основные типы организации данных и связей между ними. Системы управления базами данных, особенности их классификации.

    презентация, добавлен 22.05.2016

  • Понятие банка данных, базы данных и СУБД. Логическое представление и система управления базами данных, ее функции: определение, обработка, безопасность, целостность и введение словаря данных. Модели, поддерживаемые СУБД. Области применения БД в экономике.

    контрольная работа, добавлен 03.12.2013

  • Создание таблиц в базе данных Access, их корректировка. Связь между таблицами с помощью общих полей. Создание форм для просмотра таблиц с использованием Мастер форм. Значения полей, основные типы данных и их описания. Сохранение новой базы данных.

    контрольная работа, добавлен 27.10.2013

  • Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.

    дипломная работа, добавлен 30.06.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.