Анализ и установка платформы для распределённой обработки больших данных "Apache Hadoop"
Исследование платформы для распределённой обработки больших данных "Apache Hadoop". Описание алгоритма её установки и настройки. Оценка возможности использования "Apache Hadoop" для обработки огромного количества ежеминутно поступающей информации.
Подобные документы
Изучение вопросов правового обеспечения, лицензирования и сертификации в области защиты информации, особенности использования вычислительной техники. Проблемы и способы информационной защиты в автоматизированных системах обработки данных (АСОД).
реферат, добавлен 21.02.2010Анализ способов аналитической обработки данных. Изучение технических аспектов многомерного хранения данных. Интеллектуальный анализ данных (Data Mining). Обзор технологий резервного копирования. Анализ технологий хранения резервных копий и данных.
реферат, добавлен 17.09.2017Исследование алгоритмов разработки информационных систем для медико-коммерческих фирм. Методы обработки статистических данных, принадлежащих произвольной предметной области. Программная реализация информационной системы обработки статистических данных.
статья, добавлен 10.03.2019Описание технологии обработки текстовых, графических и табличных данных. Характеристика гипертекстовой технологии представления информации. Мультимедиа – интерактивная технология, обеспечивающая работу с неподвижными изображениями, текстом и звуком.
реферат, добавлен 16.03.2014Изучение проблемы обработки и хранения больших объемов данных. Неэффективность стандартных подходов, используемых для проектирования архитектуры настольных приложений. Проведение опытов, замеряющих скорость выполнения основных операций с базами данных.
статья, добавлен 07.03.2019Описание структуры процесса анализа характеристик потока событий. Изучение статистических методов анализа данных с целью установления стационарности потока заявок. Описание этапов при исследовании входных потоков данных для систем обработки информации.
статья, добавлен 27.07.2017История развития систем и современные способы обработки информации. Применение автоматизированные систем управления. Проблемы, связанные с компьютерными способами обработки данных и их отличие от неавтоматизированных. Основные задачи, решаемые при этом.
реферат, добавлен 23.07.2010Эволюция вычислительных систем. Системы пакетной обработки. Появление глобальных и локальных сетей. Создание стандартных технологий локальных сетей. Понятие компьютерной сети. Линии связи и их типы. Сетевые технологии обработки данных, интернет.
дипломная работа, добавлен 28.10.2010Организационная структура системы государственной статистики Российской Федерации. Комплексы электронной обработки информации - одна из организационно-технологических форм автоматизированного решения задачи обработки данных статистической отчетности.
курсовая работа, добавлен 14.04.2015Создание веб-сайта, с интегрированными формами обработки оперативной информации деятельности агропромышленного комплекса. Информационные процессы обработки и представления оперативных данных. Проектирование HTML-каркаса главной страницы web-сайта.
презентация, добавлен 26.04.2015Изучение технологий управления, создания и обработки данных с применением вычислительной техники. Анализ хранения больших объёмов информации на машинных носителях. Обзор признаков информационного общества, уровня культуры по обращению с информацией.
презентация, добавлен 10.05.2012Анализ наиболее успешных IT решений в области мониторинга больших данных (big data) и осуществление выбора IT решения, его обоснование. Рассмотрение и анализ продуктов Microsoft Azure HDInsight, IBM InfoSphere Streams, платформы Amazon Kinesis Streams.
статья, добавлен 17.08.2018Понятие экономической информации, методы ее обработки. Этапы технологических процессов. Особенности автоматизации бухгалтерского учета. Возможности программы Excel. Организация данных в программе. Правила работы с формулами. Копирование содержимого ячеек.
курсовая работа, добавлен 13.12.2019Анализ методов загрузки информации из хранилища источников в информационную систему приемника данных. Выбор инструмента извлечения данных и их преобразования перед загрузкой в место назначения. Реализация ETL-процесса на базе платформы 1С:Предприятие.
статья, добавлен 18.01.2021Описание аналитической платформы Deductor. Доступ к серверу из сторонних приложений и управление его работой. Импорт данных, сохраненных в текстовом формате. Состав и назначение модулей. Представление алгоритма типового сценария. Визуализация информации.
курсовая работа, добавлен 07.09.2014Обзор некоторых новых процедур обработки данных, включенных в последние годы в статистическую систему IBM SPSS Statistics, которые могут быть полезны психологам в исследованиях. Характеристика нового многоуровневого типа статистического анализа данных.
статья, добавлен 19.12.2020Методика распределения центров сбора данных по центрам обработки данных для однотипных каналов связи и с использованием нескольких типов каналов связи применяемых в системах ЖКХ. Оценка положительного экономического эффекта от применения методики.
статья, добавлен 15.05.2017Особенности платформы JavaFX2. Приобретение практических навыков создания насыщенных пользовательских интерфейсов Java-программ. Добавление данных в таблицу с одновременным изменением диаграммы. Сохранение данных в файл. Описание тестовых примеров.
лабораторная работа, добавлен 17.05.2015Режимы и главные способы обработки данных, а также комплекс технических средств, используемых в данном процессе, их классификация и разновидности. Информационные технология управления, выбор вариантов использования в фирме в условиях рыночной экономики.
контрольная работа, добавлен 04.03.2014Разработка математической модели решения задачи об оптимальном размещении распределённой базы данных по узлам локальной вычислительной сети на базе двухуровневой клиент-серверной архитектуры по критерию минимума среднего времени реакции системы.
статья, добавлен 27.07.2017Рассмотрение понятия информационных систем, роль в формировании решений на различных уровнях управления. Виды обработки информации. Трехуровневая модель организации базы данных. Характеристика СУБД Microsoft Access. Эволюция концепций обработки данных.
шпаргалка, добавлен 16.12.2014Необходимость правового обеспечения, лицензирования и сертификации в области защиты информации. Применение организационных, аппаратных, криптографических, программных и физических методов и средств защиты автоматизированных систем обработки данных.
реферат, добавлен 12.09.2012Распределенные базы данных и программное обеспечение промежуточного слоя. Целостность данных и прозрачность расположения. Обзор методики обработки распределенных запросов. Межоперабельность и технология тиражирования данных. Архитектура "клиент-сервер".
реферат, добавлен 14.02.2013Рассматриваются устройство и работа платформы для автоматизированной обработки данных, предоставляющей пользователю связный текстовый отчет с результатами анализа. Основные компоненты общей схемы работы сервиса, компоненты в алгоритмах и программном коде.
статья, добавлен 03.04.2018Составляющие системы дистрибутивных баз данных. Изучение понятия локальной автономии. Независимость от центрального узла. Исследование основных преимуществ распределенных систем. Возможность репликации данных. Операция обработки распределенных запросов.
презентация, добавлен 29.09.2013