Определение текстовых заимствований и нечетких дубликатов на основе алгоритма шинглов

Поиск дубликатов и плагиата среди веб-страниц, как одно из главных направлений сравнения текстов. Алгоритм шинглов, как один из эффективных алгоритмов определения сходства документов на предмет заимствования. Удаление частично измененного копипаста.

Подобные документы

  • Вопросы применения алгоритмов управления на базе нечеткой логики для сельскохозяйственных роботов-культиваторов. Составление нечетких правил и методов дефазификации. Алгоритмы управления мобильной платформой, приводами, приводящими в движение манипулятор.

    статья, добавлен 28.11.2021

  • Определение сущности псевдокода. Рассмотрение и характеристика главных преимуществ программного способа записи алгоритмов. Ознакомление с примерами записи арифметических выражений. Исследование особенностей графического способа записи алгоритмов.

    контрольная работа, добавлен 04.04.2016

  • Сравнительная характеристика существующих методов модификации базового фрактального алгоритма сжатия изображения. Использование коэффициента корреляции Пирсона в качестве критерия оптимальности. Особенности применения пирамидального метода сравнения.

    статья, добавлен 01.07.2018

  • Общие сведения о графах. Реализация алгоритма Флойда. Графы и способы их представления. Пути и циклы в графах. Программная реализация алгоритма поиска кратчайшего пути между двумя любыми вершинами графа. Пример применения алгоритма Флойда на практике.

    курсовая работа, добавлен 19.11.2011

  • Задачи для определения оптимальной модели нейронной сети. Характеристика общей модели нейронной сети. Сравнение различных алгоритмов поиска оптимального пути. Эффективность пчелиного алгоритма в решении задачи исследования и патрулирования местности.

    статья, добавлен 08.03.2019

  • Деление информационного обеспечения на локальное и сетевое. Общие рекомендации по формированию запроса по поиску документов. Основные функции текстовых и табличных процессоров: редактирование текстовых файлов, правила работы с электронными таблицами.

    контрольная работа, добавлен 01.08.2009

  • Состав и функциональные возможности компьютерных систем подготовки текстовых документов, технология подготовки на основе применения текстового процессора. Состав и назначение операций редактирования. Возможности и особенности технологии подготовки.

    контрольная работа, добавлен 07.04.2014

  • Определение понятия и история создания генетических алгоритмов в решении оптимизационных задач. Анализ их конкурентоспособности при решении NP-трудных задач в сравнении с динамическим и линейным программированием. Схема работы и пример алгоритма.

    контрольная работа, добавлен 09.03.2014

  • Построение математической модели и алгоритма решения задачи при помощи применения метода линейных алгоритмов. Использование разветвляющихся алгоритмов при решении задач, применение циклических алгоритмов. Алгоритмы обработки информационных массивов.

    отчет по практике, добавлен 22.06.2011

  • Целевые функции и анализ существующих алгоритмов маршрутизации. Борьба с перегрузкой и постановка задачи маршрутизации. Разработка алгоритма маршрутизации трафика в MPLS-сети. Разработка алгоритма динамической маршрутизации на базе протокола OSPF.

    курсовая работа, добавлен 12.12.2014

  • Основы работы с операционными системами типа Windows. Создание текстовых документов с помощью Microsoft Word. Программирование в среде Turbo Pascal. Проведение численных и символьных расчетов в Mathcad. Программирование алгоритмов циклической структуры.

    учебное пособие, добавлен 19.05.2016

  • Применение алгоритмов шифрования данных в системе электронного документооборота. Алгоритм RSA: история создания. Система шифрования RSA. Цифровая электронная подпись. Способы взлома алгоритма RSA. Оптимизация алгоритма RSA в приложениях шифрования.

    реферат, добавлен 17.03.2012

  • Основные свойства базы нечетких продукционных правил и критерии их проверки. Понятие частичной непротиворечивости, полноты базы нечетких продукционных правил. База правил как частично избыточная, ее правила, идентичные по посылкам или заключениям.

    статья, добавлен 06.05.2018

  • Характеристика основных способов сжатия информации. Группы алгоритмов обратимого сжатия данных. Основная идея алгоритма Лемпеля-Зива. Особенности алгоритма LZ77 и LZ78. Модификации алгоритма, предложенные Т. Уэлчем. Основы процесса распаковки данных.

    реферат, добавлен 15.10.2016

  • Использование генетических алгоритмов как механизма для автоматического проектирования схем на реконфигурируемых платформах. Требования к проектированию генетических алгоритмов. Аппаратная реализация компактного и вероятностного генетического алгоритма.

    статья, добавлен 16.01.2018

  • Определения и понятие теории графов. Алгоритм нахождения кратчайшего расстояния от одной из вершин графа до всех остальных, работающий только для графов без ребер отрицательного веса. Реализация алгоритма Дейкстры на языке программирования Delphi.

    курсовая работа, добавлен 16.06.2014

  • Понятие кластеризации и принципы работы ее алгоритмов. Этапы применения кластерного анализа для получения оптимального результата. Классификация алгоритмов кластеризации. Принцип работы алгоритма LargeItem. Понятие транзакций и проблема их кластеризации.

    дипломная работа, добавлен 21.03.2016

  • Анализ использования реляционного подхода организации баз данных. Характеристика семантической нагрузки понятия домена. Особенность отсутствия кортежей-дубликатов. Изучение атомарности значений атрибутов. Исследование набора именованных схем отношений.

    контрольная работа, добавлен 26.11.2015

  • Использование многомерных нечетких интервально-логических регуляторов для решения задач регулирования. Особенности программной реализации алгоритмов интервализации и деинтервализации. Примеры реализации алгоритма интервализации на разных языках.

    статья, добавлен 17.07.2018

  • Распространение текстовых файлов и проблемы, связанные с ними. Оформление текста, ряд ограничений для онлайновых документов. Редакторы неформатированных текстов и редакторы, создающие текст с элементами разметки. Примеры кодирования русского текста.

    лекция, добавлен 18.05.2014

  • Описание основ квантовой теории информации, место в ней понятия квантовой запутанности. Рассмотрение алгоритма работы универсального квантового алгоритма в терминах квантового компьютинга. Влияние уровня запутанности на работу квантовых алгоритмов.

    статья, добавлен 20.07.2018

  • Характеристика алгоритма. Сетевые конфигурации. Многослойная сеть, которая может обучаться с помощью процедуры обратного распространения. Этапы выполнения алгоритма. Программа создания однонаправленной сети. Статистика использования других алгоритмов.

    статья, добавлен 15.08.2020

  • Разработка программных средств автоматизированной выработки алгоритмов поведения интеллектуального агента с использованием генетического алгоритма для генерации стратегических решений. Анализ модели интерпретации алгоритма на языке макрокоманд робота.

    статья, добавлен 27.02.2019

  • Проектирование структуры данных, определение структуры алгоритма. Понятие бинарного поиска, его распространение и преимущества. Инициализация, основной цикл, получение центрального ключа, проверка на успешное завершение, сравнение, безуспешный поиск.

    курсовая работа, добавлен 28.06.2016

  • Понятие алгоритма и его исполнитель: среда исполнителя, система допустимых действий и система команд исполнителя. Свойства алгоритма и его способы записи, а также условные графические обозначения в схемах. Компьютер как формальный исполнитель алгоритмов.

    презентация, добавлен 23.02.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.