Определение текстовых заимствований и нечетких дубликатов на основе алгоритма шинглов
Поиск дубликатов и плагиата среди веб-страниц, как одно из главных направлений сравнения текстов. Алгоритм шинглов, как один из эффективных алгоритмов определения сходства документов на предмет заимствования. Удаление частично измененного копипаста.
Подобные документы
- 76. Разработка алгоритмов различной структуры и их реализация с помощью компьютерных программных средств
Приобретение практических навыков по разработке, написанию и отладки алгоритмов и программ. Рассмотрение особенностей использования языка программирования Бейсик и среды разработки Basic-256. Математическая модель и блок-схема алгоритма её решения.
презентация, добавлен 05.12.2021 Рассмотрение алгоритмов поиска образца в строке и таких, которые работают с динамическими структурами данных: топологической сортировкой, генератором перекрёстных ссылок. Описание линейного поиска, алгоритмов Кнута, Мориса и Пратта, Боуэра и Мура, Рабина.
методичка, добавлен 13.09.2015Понятие алгоритма и его основные свойства. Классификация алгоритмов по типу реализуемого вычислительного процесса. Преимущество графического способа описания алгоритмов перед словесным. Базовые и дополнительные алгоритмические структуры, их назначение.
контрольная работа, добавлен 10.10.2012Вопросы применения алгоритмов управления на базе нечеткой логики для сельскохозяйственных роботов-культиваторов. Составление нечетких правил и методов дефазификации. Алгоритмы управления мобильной платформой, приводами, приводящими в движение манипулятор.
статья, добавлен 28.11.2021Определение сущности псевдокода. Рассмотрение и характеристика главных преимуществ программного способа записи алгоритмов. Ознакомление с примерами записи арифметических выражений. Исследование особенностей графического способа записи алгоритмов.
контрольная работа, добавлен 04.04.2016Сравнительная характеристика существующих методов модификации базового фрактального алгоритма сжатия изображения. Использование коэффициента корреляции Пирсона в качестве критерия оптимальности. Особенности применения пирамидального метода сравнения.
статья, добавлен 01.07.2018Общие сведения о графах. Реализация алгоритма Флойда. Графы и способы их представления. Пути и циклы в графах. Программная реализация алгоритма поиска кратчайшего пути между двумя любыми вершинами графа. Пример применения алгоритма Флойда на практике.
курсовая работа, добавлен 19.11.2011Задачи для определения оптимальной модели нейронной сети. Характеристика общей модели нейронной сети. Сравнение различных алгоритмов поиска оптимального пути. Эффективность пчелиного алгоритма в решении задачи исследования и патрулирования местности.
статья, добавлен 08.03.2019Деление информационного обеспечения на локальное и сетевое. Общие рекомендации по формированию запроса по поиску документов. Основные функции текстовых и табличных процессоров: редактирование текстовых файлов, правила работы с электронными таблицами.
контрольная работа, добавлен 01.08.2009Состав и функциональные возможности компьютерных систем подготовки текстовых документов, технология подготовки на основе применения текстового процессора. Состав и назначение операций редактирования. Возможности и особенности технологии подготовки.
контрольная работа, добавлен 07.04.2014Определение понятия и история создания генетических алгоритмов в решении оптимизационных задач. Анализ их конкурентоспособности при решении NP-трудных задач в сравнении с динамическим и линейным программированием. Схема работы и пример алгоритма.
контрольная работа, добавлен 09.03.2014- 87. Первичные профессиональные умения и навыки по профессии "Оператор электронно-вычислительных машин"
Построение математической модели и алгоритма решения задачи при помощи применения метода линейных алгоритмов. Использование разветвляющихся алгоритмов при решении задач, применение циклических алгоритмов. Алгоритмы обработки информационных массивов.
отчет по практике, добавлен 22.06.2011 Целевые функции и анализ существующих алгоритмов маршрутизации. Борьба с перегрузкой и постановка задачи маршрутизации. Разработка алгоритма маршрутизации трафика в MPLS-сети. Разработка алгоритма динамической маршрутизации на базе протокола OSPF.
курсовая работа, добавлен 12.12.2014Основы работы с операционными системами типа Windows. Создание текстовых документов с помощью Microsoft Word. Программирование в среде Turbo Pascal. Проведение численных и символьных расчетов в Mathcad. Программирование алгоритмов циклической структуры.
учебное пособие, добавлен 19.05.2016Применение алгоритмов шифрования данных в системе электронного документооборота. Алгоритм RSA: история создания. Система шифрования RSA. Цифровая электронная подпись. Способы взлома алгоритма RSA. Оптимизация алгоритма RSA в приложениях шифрования.
реферат, добавлен 17.03.2012Основные свойства базы нечетких продукционных правил и критерии их проверки. Понятие частичной непротиворечивости, полноты базы нечетких продукционных правил. База правил как частично избыточная, ее правила, идентичные по посылкам или заключениям.
статья, добавлен 06.05.2018Характеристика основных способов сжатия информации. Группы алгоритмов обратимого сжатия данных. Основная идея алгоритма Лемпеля-Зива. Особенности алгоритма LZ77 и LZ78. Модификации алгоритма, предложенные Т. Уэлчем. Основы процесса распаковки данных.
реферат, добавлен 15.10.2016Использование генетических алгоритмов как механизма для автоматического проектирования схем на реконфигурируемых платформах. Требования к проектированию генетических алгоритмов. Аппаратная реализация компактного и вероятностного генетического алгоритма.
статья, добавлен 16.01.2018Определения и понятие теории графов. Алгоритм нахождения кратчайшего расстояния от одной из вершин графа до всех остальных, работающий только для графов без ребер отрицательного веса. Реализация алгоритма Дейкстры на языке программирования Delphi.
курсовая работа, добавлен 16.06.2014Понятие кластеризации и принципы работы ее алгоритмов. Этапы применения кластерного анализа для получения оптимального результата. Классификация алгоритмов кластеризации. Принцип работы алгоритма LargeItem. Понятие транзакций и проблема их кластеризации.
дипломная работа, добавлен 21.03.2016Анализ использования реляционного подхода организации баз данных. Характеристика семантической нагрузки понятия домена. Особенность отсутствия кортежей-дубликатов. Изучение атомарности значений атрибутов. Исследование набора именованных схем отношений.
контрольная работа, добавлен 26.11.2015Использование многомерных нечетких интервально-логических регуляторов для решения задач регулирования. Особенности программной реализации алгоритмов интервализации и деинтервализации. Примеры реализации алгоритма интервализации на разных языках.
статья, добавлен 17.07.2018Характеристика алгоритма. Сетевые конфигурации. Многослойная сеть, которая может обучаться с помощью процедуры обратного распространения. Этапы выполнения алгоритма. Программа создания однонаправленной сети. Статистика использования других алгоритмов.
статья, добавлен 15.08.2020Распространение текстовых файлов и проблемы, связанные с ними. Оформление текста, ряд ограничений для онлайновых документов. Редакторы неформатированных текстов и редакторы, создающие текст с элементами разметки. Примеры кодирования русского текста.
лекция, добавлен 18.05.2014- 100. Разработка методики моделирования запутанных квантовых вычислений в области квантовых алгоритмов
Описание основ квантовой теории информации, место в ней понятия квантовой запутанности. Рассмотрение алгоритма работы универсального квантового алгоритма в терминах квантового компьютинга. Влияние уровня запутанности на работу квантовых алгоритмов.
статья, добавлен 20.07.2018