Ефективний емпіричний метод дедублікації на файловому рівні
Вдосконалення методу пошуку дублікатів контенту у файловій системі на основі емпіричного правила доцільності хешування. Характеристика побудови математичних сподівань тривалості процедур перетворення вхідного масиву даних і попарного порівняння файлів.
Подобные документы
Розробка архітектури розподіленої системи збереження енергетичних даних, методу швидкої вставки та пошуку даних у розподіленій системі з врахуванням партиціонування за різними ознаками. Репартиціонування даних під час переповнення розмірів партиції.
статья, добавлен 29.03.2020Ідентифікація музичного твору на основі аудіо контенту. Застосування кластерного аналізу під час формування шаблонів музичних творів в базах даних, що дозволяє зменшити обсяги пам'яті для їх зберігання. Порівняння фрагменту музичного твору з шаблонами.
статья, добавлен 19.02.2016Ефективність методів пошуку інформації у файлах баз даних для законів розподілу ймовірностей звертання до записів. Побудова схем методів та розробка нових підходів до пошуку інформації у файлах. Кількість рівнів для методу r–рівневого блочного пошуку.
автореферат, добавлен 26.08.2015Характеристика можливостей застосування відомого механізму хешування для суто криптографічних перетворень. Використання даного механізму для криптографічних перетворень інформаційних об’єктів та для задач контролю та поновлення їхньої діяльності.
статья, добавлен 30.08.2016Аналізу існуючих методів контекстного пошуку зображень в електронних колекціях. Створення нового методу кластеризації для побудови ефективного механізму контекстного пошуку зображень у базах даних. Способи збільшення швидкодії запропонованого методу.
автореферат, добавлен 29.08.2014Метод посткоординатного індексування як один із методів згортання та пошуку інформації. Вимоги для отримання релевантних даних системи прогнозування, особливості індексування координатного типу багатогалузевого документу для отримання пошукового образу.
статья, добавлен 16.11.2017- 7. Хеш таблиця
Характеристика хешування таблиці як методу реалізації словників, що вимагає фіксованого часу на виконання операторів і знімає обмеження безлічі, які повинні бути підмножинами в деякій кінцевої універсальної множини з допомогою масивів і списків.
контрольная работа, добавлен 14.01.2010 Аналіз застосування теорії мультимножин для побудови індивідуальної навчальної траєкторії студента в адаптивній системі дистанційного навчання. Технологія побудови бази знань навчального контенту на основі найменших неподільних квантів інформації.
статья, добавлен 25.12.2016Розробка моделі порівняння частково впорядкованих множин для аналізу результатів сегментації зображень, критерії їх оцінки для забезпечення пошуку областей інтересу зображення запиту. Сутність, значення та характеристика методу індексації та організації.
автореферат, добавлен 24.07.2014Вибір моделі геометричних перетворень як основи створення високоефективних методів класифікації, особливості завдань видобування даних. Кусковий метод побудови розділяючих поверхонь на основі формування дерева поділу на класи і матриці штрафів-заохочень.
автореферат, добавлен 24.07.2014Сортування та пошук даних. Лінійний (послідовний), бінарний (двійковий) метод пошуку. Полегшення подальшого пошуку елементів у множині при обробці даних. Теорія складності обчислень. Використання методів пошуку на практиці. Алгоритм Кнута-Морріса-Пратта.
курсовая работа, добавлен 19.04.2017Розробка та дослідження комп'ютерних систем стиску даних, які забезпечують обробку потоків даних за різними алгоритмами стиску. Характеристика нового методу побудови процесорів стиску потоків даних на основі реконфігурованої комп'ютерної системи стиску.
автореферат, добавлен 28.08.2015- 13. Сховище даних
Розгляд різновиду баз даних – сховища. Характеристика функцій систем підтримки прийняття рішень. Оцінка особливостей формування аналітичних звітів на основі традиційних баз даних. Визначення основних варіантів побудови систем на основі сховищ даних.
реферат, добавлен 19.07.2017 Дослідження процесу формування показників масиву даних для ідентифікації авторства друкованого тексту. Залежність інформативності ознак та їх вибору від завдань ідентифікації. Використання технології розпізнавання образів задля пошуку інформативних ознак.
статья, добавлен 14.07.2016Характеристика інфологічної та даталогічної моделі бази даних. Система інформаційних, математичних, програмних, мовних, організаційних і технічних засобів, які необхідні для інтегрованого нагромадження, зберігання, ведення, пошуку і видачі даних.
контрольная работа, добавлен 19.09.2009Вивчення основних напрямів в комп'ютерній стеганографії. Розгляд особливостей використання EXIF в цифровій фотографії. Характеристика аспектів Base 64 шифрування. Переваги та недоліки стеганографічного методу приховування файлів у exif-заголовках.
статья, добавлен 01.05.2014Розробка методів і засобів, впровадження яких дозволить підвищувати достовірність і повноту баз даних в автоматизованих системах управління в процесі їх інтеграції. Удосконалення методу злиття записів та методу пошуку природної інформаційної надмірності.
автореферат, добавлен 26.07.2014Аналіз стану сучасних технологічних рішень щодо створення єдиного сховища даних. Характеристика варіантів та можливостей побудови інформаційної інфраструктури на основі центру обробки даних. Особливості процесу побудови власного центру обробки даних.
статья, добавлен 23.09.2020Підвищення якості обробки цифрової інформації на основі математичних моделей паралельно-ієрархічного (ПІ) перетворення. Визначення та прогнозування координат зображень плям лазерних пучків. Використання математичного аналізу та теорії часових рядів.
автореферат, добавлен 14.09.2014- 20. Структурна організація пристроїв порівняння зображень для оптоелектронних паралельних процесорів
Схемотехнічні рішення побудови і математична модель пристрою порівняння-віднімання зображень на основі біспін-приладу. Дослідження пристроїв порівняння зображень на основі біспін-приладів з метою визначення їх технічних параметрів і оцінки адекватності.
автореферат, добавлен 29.09.2014 На основі проведених експериментів дослідження доцільності використання даних методів для різних типів даних та архітектури нейронних мереж. Характеристика існуючих методів оптимізації та типів розподілених обчислень для тренування нейронних мереж.
статья, добавлен 28.10.2020Характеристика принципу роботи симетричних алгоритмів блочного шифрування. Послідовність дій при використанні асиметричного алгоритму для шифрування. Аналіз гібридного алгоритму. Опис методу захисту даних на основі багатошарового гібридного шифрування.
статья, добавлен 13.02.2016Характеристика методу побудови логічних залежностей між небінарними ознаками об’єктів в базах даних у вигляді агрегованих асоціативних правил. Аналіз результатів, що отримано, у вигляді програмної системи побудови узагальнених асоціативних правил.
автореферат, добавлен 29.08.2014Дослідження концепції побудови віртуальних приладів, зовнішнього вигляду вікон інтерфейсу користувача та результатів відлагодження програмного забезпечення. Аналіз схеми алгоритму отримання масиву даних сигналу в залежності від його форми та методу.
практическая работа, добавлен 26.11.2011Загальна характеристика FTP зокрема у порівнянні з HTTP-протоколом. Система взаємодії компонентів і програмне забезпечення доступу до FTP. Режими обміну даними, передача файлів різних типів. Пошук файлів на FTP-серверах. Експлуатація власного FTP-сервера.
реферат, добавлен 04.10.2011