Определение текстовых заимствований и нечетких дубликатов на основе алгоритма шинглов

Поиск дубликатов и плагиата среди веб-страниц, как одно из главных направлений сравнения текстов. Алгоритм шинглов, как один из эффективных алгоритмов определения сходства документов на предмет заимствования. Удаление частично измененного копипаста.

Подобные документы

  • Приобретение практических навыков по разработке, написанию и отладки алгоритмов и программ. Рассмотрение особенностей использования языка программирования Бейсик и среды разработки Basic-256. Математическая модель и блок-схема алгоритма её решения.

    презентация, добавлен 05.12.2021

  • Рассмотрение алгоритмов поиска образца в строке и таких, которые работают с динамическими структурами данных: топологической сортировкой, генератором перекрёстных ссылок. Описание линейного поиска, алгоритмов Кнута, Мориса и Пратта, Боуэра и Мура, Рабина.

    методичка, добавлен 13.09.2015

  • Понятие алгоритма и его основные свойства. Классификация алгоритмов по типу реализуемого вычислительного процесса. Преимущество графического способа описания алгоритмов перед словесным. Базовые и дополнительные алгоритмические структуры, их назначение.

    контрольная работа, добавлен 10.10.2012

  • Вопросы применения алгоритмов управления на базе нечеткой логики для сельскохозяйственных роботов-культиваторов. Составление нечетких правил и методов дефазификации. Алгоритмы управления мобильной платформой, приводами, приводящими в движение манипулятор.

    статья, добавлен 28.11.2021

  • Определение сущности псевдокода. Рассмотрение и характеристика главных преимуществ программного способа записи алгоритмов. Ознакомление с примерами записи арифметических выражений. Исследование особенностей графического способа записи алгоритмов.

    контрольная работа, добавлен 04.04.2016

  • Сравнительная характеристика существующих методов модификации базового фрактального алгоритма сжатия изображения. Использование коэффициента корреляции Пирсона в качестве критерия оптимальности. Особенности применения пирамидального метода сравнения.

    статья, добавлен 01.07.2018

  • Общие сведения о графах. Реализация алгоритма Флойда. Графы и способы их представления. Пути и циклы в графах. Программная реализация алгоритма поиска кратчайшего пути между двумя любыми вершинами графа. Пример применения алгоритма Флойда на практике.

    курсовая работа, добавлен 19.11.2011

  • Задачи для определения оптимальной модели нейронной сети. Характеристика общей модели нейронной сети. Сравнение различных алгоритмов поиска оптимального пути. Эффективность пчелиного алгоритма в решении задачи исследования и патрулирования местности.

    статья, добавлен 08.03.2019

  • Деление информационного обеспечения на локальное и сетевое. Общие рекомендации по формированию запроса по поиску документов. Основные функции текстовых и табличных процессоров: редактирование текстовых файлов, правила работы с электронными таблицами.

    контрольная работа, добавлен 01.08.2009

  • Состав и функциональные возможности компьютерных систем подготовки текстовых документов, технология подготовки на основе применения текстового процессора. Состав и назначение операций редактирования. Возможности и особенности технологии подготовки.

    контрольная работа, добавлен 07.04.2014

  • Определение понятия и история создания генетических алгоритмов в решении оптимизационных задач. Анализ их конкурентоспособности при решении NP-трудных задач в сравнении с динамическим и линейным программированием. Схема работы и пример алгоритма.

    контрольная работа, добавлен 09.03.2014

  • Построение математической модели и алгоритма решения задачи при помощи применения метода линейных алгоритмов. Использование разветвляющихся алгоритмов при решении задач, применение циклических алгоритмов. Алгоритмы обработки информационных массивов.

    отчет по практике, добавлен 22.06.2011

  • Целевые функции и анализ существующих алгоритмов маршрутизации. Борьба с перегрузкой и постановка задачи маршрутизации. Разработка алгоритма маршрутизации трафика в MPLS-сети. Разработка алгоритма динамической маршрутизации на базе протокола OSPF.

    курсовая работа, добавлен 12.12.2014

  • Основы работы с операционными системами типа Windows. Создание текстовых документов с помощью Microsoft Word. Программирование в среде Turbo Pascal. Проведение численных и символьных расчетов в Mathcad. Программирование алгоритмов циклической структуры.

    учебное пособие, добавлен 19.05.2016

  • Применение алгоритмов шифрования данных в системе электронного документооборота. Алгоритм RSA: история создания. Система шифрования RSA. Цифровая электронная подпись. Способы взлома алгоритма RSA. Оптимизация алгоритма RSA в приложениях шифрования.

    реферат, добавлен 17.03.2012

  • Основные свойства базы нечетких продукционных правил и критерии их проверки. Понятие частичной непротиворечивости, полноты базы нечетких продукционных правил. База правил как частично избыточная, ее правила, идентичные по посылкам или заключениям.

    статья, добавлен 06.05.2018

  • Характеристика основных способов сжатия информации. Группы алгоритмов обратимого сжатия данных. Основная идея алгоритма Лемпеля-Зива. Особенности алгоритма LZ77 и LZ78. Модификации алгоритма, предложенные Т. Уэлчем. Основы процесса распаковки данных.

    реферат, добавлен 15.10.2016

  • Использование генетических алгоритмов как механизма для автоматического проектирования схем на реконфигурируемых платформах. Требования к проектированию генетических алгоритмов. Аппаратная реализация компактного и вероятностного генетического алгоритма.

    статья, добавлен 16.01.2018

  • Определения и понятие теории графов. Алгоритм нахождения кратчайшего расстояния от одной из вершин графа до всех остальных, работающий только для графов без ребер отрицательного веса. Реализация алгоритма Дейкстры на языке программирования Delphi.

    курсовая работа, добавлен 16.06.2014

  • Понятие кластеризации и принципы работы ее алгоритмов. Этапы применения кластерного анализа для получения оптимального результата. Классификация алгоритмов кластеризации. Принцип работы алгоритма LargeItem. Понятие транзакций и проблема их кластеризации.

    дипломная работа, добавлен 21.03.2016

  • Анализ использования реляционного подхода организации баз данных. Характеристика семантической нагрузки понятия домена. Особенность отсутствия кортежей-дубликатов. Изучение атомарности значений атрибутов. Исследование набора именованных схем отношений.

    контрольная работа, добавлен 26.11.2015

  • Использование многомерных нечетких интервально-логических регуляторов для решения задач регулирования. Особенности программной реализации алгоритмов интервализации и деинтервализации. Примеры реализации алгоритма интервализации на разных языках.

    статья, добавлен 17.07.2018

  • Характеристика алгоритма. Сетевые конфигурации. Многослойная сеть, которая может обучаться с помощью процедуры обратного распространения. Этапы выполнения алгоритма. Программа создания однонаправленной сети. Статистика использования других алгоритмов.

    статья, добавлен 15.08.2020

  • Распространение текстовых файлов и проблемы, связанные с ними. Оформление текста, ряд ограничений для онлайновых документов. Редакторы неформатированных текстов и редакторы, создающие текст с элементами разметки. Примеры кодирования русского текста.

    лекция, добавлен 18.05.2014

  • Описание основ квантовой теории информации, место в ней понятия квантовой запутанности. Рассмотрение алгоритма работы универсального квантового алгоритма в терминах квантового компьютинга. Влияние уровня запутанности на работу квантовых алгоритмов.

    статья, добавлен 20.07.2018

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.