Методы классификации текстов и определения качества контента
Понятие классификации документов, определение качества контента. Особенности контентного и ссылочного спама. Характеристика методов классификации, которые используют различные математические аппараты. Обнаружение ошибок генераторов спам-страниц.
Подобные документы
Электронная почта как способ передачи данных в компьютерных сетях, широко используемый в Интернете. Фишинг - метод мошенничества с помощью спама. Анализ криптографических методов защиты информации. Основные сетевые протоколы, используемые в E-Mail.
курсовая работа, добавлен 07.12.2014Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
лекция, добавлен 19.10.2013Виды и развитие классификационных систем. Понятие многоаспектности классификации, установление ее признаков. Фасетная классификация Ранганатана и оценка возможностей её использования. Влияние идей ученого на развитие теории информационно-поисковых языков.
курсовая работа, добавлен 01.02.2016Характеристика особенностей измерения модели зрелости контента, а также персонала, процессов и систем на разных ее этапах. Описание этапов индивидуальной работы, работы в командах, совершенствования и инноваций. Анализ платформ Joomla, Drupal, WordPress.
контрольная работа, добавлен 25.06.2016- 80. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Общая характеристика параллельной обработки данных на электронно-вычислительных машинах. Основы классификации вычислительных систем. Оценка классификации Кришнамарфи. Исследование особенностей использования параллелизма при компьютерной обработке данных.
лабораторная работа, добавлен 29.03.2016Рассмотрение проблемы классификации сообществ в социальной сети. Применение рекуррентных и сверточных нейронных сетей для классификации групп пользователей по степени радикальности. Методы предварительной обработки данных для построения классификаторов.
статья, добавлен 21.05.2021Сайт как совокупность логически связанных между собой веб-страниц; также место расположения контента сервера. Технико-экономическая характеристика предприятия. Создание системы авторизации и групп пользователей. Программное и техническое обеспечение.
дипломная работа, добавлен 25.05.2015Реализация информатизации в российских судах общей юрисдикции происходит с помощью Государственной автоматизированной программы РФ "Правосудие". Ручное занесение самого дела в одну из выделенных при классификации групп, после выполнения его изучения.
статья, добавлен 26.07.2018Способы ускорения процессов разработки и тестирования программного обеспечения с целью повышения качества выдаваемого продукта. Обнаружение разнообразных дефектов и слабых мест исходного кода. Исследование безопасности, поиск уязвимостей и ошибок.
статья, добавлен 03.05.2019Исследование и разработка моделей, методов и средств совершенствования качества функционирования информационных систем. Разработка системы дескриптивной, математической и физической модели показателей качества и алгоритма исправления ошибок в задачах ИС.
автореферат, добавлен 13.02.2018Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019Алгоритм классификации по запросу. Анализ формальных понятий. Алгоритм ленивой классификации с помощью узорных структур. Модификация рандомизации алгоритма. Модификация с предварительным расчетом гипотез. Оценка возможности визуализации гипотез.
дипломная работа, добавлен 04.08.2018Характеристика особенностей сбора данных с помощью коммуникационной технологии Wi-Fi. Описание и реализация алгоритма бинарного дерева решений "Дерево Классификации и регрессии". Классификация посетителей, на основании их перемещения по помещениям.
статья, добавлен 25.12.2016Актуальность сетевой безопасности. Использование протоколов TSP/IP для заполнения контента, угрозы и их следствия. Применение брандмауэров, фильтрующих пакеты и их использование. Анализ эффективности использование ОС Linux в анализе и защите контента.
курсовая работа, добавлен 06.02.2012Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Изучение функции "поиска подобных документов" как способа повышения качества информационного поиска в полнотекстовых базах. Алгоритм определения степени семантического сходства текста с эталоном. Схема оценки текстов на семантическое сходство с эталоном.
статья, добавлен 25.08.2020Изучение технологии решения задач интеллектуального анализа данных. Определение типа вина, обнаружение кишечной палочки методами "нейронная сеть", "байесовский классификатор", "линейная регрессия", "деревья принятия решений"," k-ближайших соседей".
практическая работа, добавлен 08.05.2017Принципы построения сетей доставки контента и конкурирующих с ними многочисленных пиринговых (одноранговых) сетей (Peer-to-Peer, P2P). Математическая модель управления ресурсами гибридной сети доставки контента с гарантированным качеством обслуживания.
статья, добавлен 19.06.2018Построение модели представления контента образовательных электронных изданий, позволяющей отражать семантическую структуру учебной информации. Разработка инструментального программного учебного комплекса с широким спектром функциональных возможностей.
автореферат, добавлен 09.09.2012Характеристика схемы объединения компьютеров предприятия в сеть. Технологии хранения данных. Методы защиты компьютеров от несанкционированного доступа, заражения вирусами и спама. Правила техники безопасности и внутреннего распорядка предприятия.
отчет по практике, добавлен 11.01.2018Поиск дубликатов и плагиата среди веб-страниц, как одно из главных направлений сравнения текстов. Алгоритм шинглов, как один из эффективных алгоритмов определения сходства документов на предмет заимствования. Удаление частично измененного копипаста.
статья, добавлен 19.02.2019Требования к функционалу программной реализации, предварительная обработка текстовых данных. Программная реализация, описание логической структуры. Зависимость качества от числа авторов и от объёма текстов. Особенности и значение индексации документов.
курсовая работа, добавлен 05.08.2018Ознакомление с организацией "ОМВД России" в г. Агидель. Управление медиатекой цифровой информации. Публикация мультимедиа контента в Интернете. Тиражирование мультимедиа контента на съемных носителях информации. Обеспечение информационной безопасности.
отчет по практике, добавлен 19.04.2022Рассмотрение классификации основных угроз информационной безопасности. Изучение основных методов и средств обеспечения безопасности компьютерной информации и вычислительных систем. Характеристика основных типов криптосистем и методов шифрования.
дипломная работа, добавлен 27.10.2018