Оптимізація системи пошуку збігів за допомогою використання алгоритмів локально-чутливого хешування наборів текстових даних
Використання алгоритмів локально чутливого хешування як способу збільшення повноти вибірки у процесі перевірки текстових документів системою пошуку збігів. Графічне представлення визначення коефіцієнта Жаккара. Особливості оптимізації методу шинглів.
Подобные документы
Класифікація систем підготовки текстових документів, їх відмінні особливості та умови практичного використання. Редактори текстів, їх функції, асортимент та значення. Настільні видавничі системи, їх можливості. Етапи підготовки текстових документів.
реферат, добавлен 24.06.2011Побудова і аналіз алгоритмів, їх покрокове проектування, визначення ефективності. Ряд алгоритмів пошуку даних, які виконуються на статичних структурах, алгоритми сортування. Програмна ілюстрація різних видів пошуку. Методи швидкого доступу до даних.
курс лекций, добавлен 03.11.2011Порівняльний аналіз алгоритмів тематичного пошуку інформації. Особливості всіх алгоритмів нечіткого пошуку з індексацією. Реалізація означеного підходу у модифікованому алгоритмі, що базується на алгоритмі Метафон з урахуванням функції Левенштейна.
статья, добавлен 23.12.2018- 4. Хеш таблиця
Характеристика хешування таблиці як методу реалізації словників, що вимагає фіксованого часу на виконання операторів і знімає обмеження безлічі, які повинні бути підмножинами в деякій кінцевої універсальної множини з допомогою масивів і списків.
контрольная работа, добавлен 14.01.2010 Аналіз предметної області та відомих реалізацій програмної системи конвертації текстових файлів. Розробка алгоритмів функціонування основних модулів програмної системи конвертації текстових файлів. Характеристика сутності інформаційної технології.
курсовая работа, добавлен 11.10.2017Ознайомлення з розширеними можливостями текстових процесорів та прийомами їх використання. особливості реалізації перевірки правопису у текстовому процесорі, роботи технології OLE, роботи з таблицями у документах MS Word. Засоби автоматизації MS Word.
лабораторная работа, добавлен 07.07.2017Етапи процесу створення комп’ютерної програми для вирішення будь-якої практичної задачі. Складність алгоритму. Характеристика алгоритмів пошуку даних. Методи швидкого доступу до даних. Мережеві алгоритми. Методи розробки алгоритмів. Програмна реалізація.
курс лекций, добавлен 01.02.2020Висвітлення оптимізаційних алгоритмів застосування принципів найкоротших шляхів пошуку. З'ясування впливу інформаційних технологій на розвиток математичного мислення студентів у процесі комп’ютерної підготовки для формування професійних компетентностей.
статья, добавлен 29.01.2016Характеристика можливостей застосування відомого механізму хешування для суто криптографічних перетворень. Використання даного механізму для криптографічних перетворень інформаційних об’єктів та для задач контролю та поновлення їхньої діяльності.
статья, добавлен 30.08.2016Розробка Web-сервісу, його використання у пошуковій системі. Формування основних вимог до програмної системи, приклади головних алгоритмів та методів. Функціональне та нефункціональне тестування бази даних. Особливості кросбраузерного тестування.
дипломная работа, добавлен 16.06.2017Удосконалення методики оцінки ефективності інформаційного пошуку. Побудова моделі поширення інформації у мережі Інтернет. Вдосконалення трирівневої системи для знаходження текстових документів. Створення метапошукової програми та інтерфейсу користувача.
автореферат, добавлен 04.03.2014Особливості здійснення пошуку в мережі Інтернет. Перелік виразів, які використовуються для пошуку в Інтернеті з питань авторського права на Україні. Визначення складових пошукових систем. Особливості використання української пошукової системи "Мета".
контрольная работа, добавлен 02.05.2019Сортування та пошук даних. Лінійний (послідовний), бінарний (двійковий) метод пошуку. Полегшення подальшого пошуку елементів у множині при обробці даних. Теорія складності обчислень. Використання методів пошуку на практиці. Алгоритм Кнута-Морріса-Пратта.
курсовая работа, добавлен 19.04.2017Ефективність методів пошуку інформації у файлах баз даних для законів розподілу ймовірностей звертання до записів. Побудова схем методів та розробка нових підходів до пошуку інформації у файлах. Кількість рівнів для методу r–рівневого блочного пошуку.
автореферат, добавлен 26.08.2015Аналізу існуючих методів контекстного пошуку зображень в електронних колекціях. Створення нового методу кластеризації для побудови ефективного механізму контекстного пошуку зображень у базах даних. Способи збільшення швидкодії запропонованого методу.
автореферат, добавлен 29.08.2014Дослідження найбільш поширених математичних методів класифікації текстових документів. Використання критеріїв інформаційної ваги слова в рубриці. Застосування наївного Байєсівського класифікатора в задачах для фільтрації спаму та автоматичної рубрикації.
статья, добавлен 27.12.2016Аналіз можливості використання генетичних алгоритмів для рішення у задачах пошуку оптимальних календарних планів. Методика використання операторів генетичного алгоритму. Загальна схема генетичного алгоритму. Значення гена в кожній хромосомі популяції.
статья, добавлен 29.01.2019Розробка методів і засобів, впровадження яких дозволить підвищувати достовірність і повноту баз даних в автоматизованих системах управління в процесі їх інтеграції. Удосконалення методу злиття записів та методу пошуку природної інформаційної надмірності.
автореферат, добавлен 26.07.2014Суть системи адаптивного пошуку оптимального шляху, спрямованої на спрощення орієнтування комірника на складі в момент збору товарів за накладною. Аналіз набору алгоритмів пошуку найкоротшого шляху. Блок-схема стандартної роботи модуля пошуку шляху.
статья, добавлен 28.10.2020Розробка і впровадження системи персоналізованого пошуку. Можливості використання діяльності віртуальних спільнот для покращення результатів пошуку. Пошук документів тематичного порталу з урахуванням результатів діяльності віртуального співтовариства.
статья, добавлен 25.10.2016- 21. Моделі та методи класифікації текстових документів в спеціалізованих інформаційно-пошукових системах
Принципи створення електронного документообігу. Розробка системи автоматизованої класифікації документів управління митної служби України. Вивчення алгоритмів роботи глобальних комп’ютерних мереж. Апробація і реалізація інформаційно-пошукових програм.
автореферат, добавлен 27.08.2014 Обґрунтування доцільності використання функції В. Левенштейна при тематичному пошуку інформації. Етапи процесу виконання пошуку створеним емулятором. Виконання перевірки введеного слова на наявність його у складеному словнику с транслітераціями.
статья, добавлен 23.12.2018Аналіз основних методів кластеризації політематичних текстових документів. Розробка моделі адаптивної нечіткої нейронної мережі. Структура та функції інструментальних засобів вирішення прикладних задач. Зміст генетичного методу зі штучним відбором.
автореферат, добавлен 20.07.2015Дослідження процесу формування показників масиву даних для ідентифікації авторства друкованого тексту. Залежність інформативності ознак та їх вибору від завдань ідентифікації. Використання технології розпізнавання образів задля пошуку інформативних ознак.
статья, добавлен 14.07.2016Забезпечення оптимального розподілу робіт в сфері навчання. Розробка алгоритму розкладу занять в університеті з урахуванням вимог викладачів та студентів. Створення математичної моделі. Використання еволюційних алгоритмів при оптимізації цільової функції.
статья, добавлен 20.04.2021