Методы классификации текстов и определения качества контента
Понятие классификации документов, определение качества контента. Особенности контентного и ссылочного спама. Характеристика методов классификации, которые используют различные математические аппараты. Обнаружение ошибок генераторов спам-страниц.
Подобные документы
Электронная почта как способ передачи данных в компьютерных сетях, широко используемый в Интернете. Фишинг - метод мошенничества с помощью спама. Анализ криптографических методов защиты информации. Основные сетевые протоколы, используемые в E-Mail.
курсовая работа, добавлен 07.12.2014Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
лекция, добавлен 19.10.2013Виды и развитие классификационных систем. Понятие многоаспектности классификации, установление ее признаков. Фасетная классификация Ранганатана и оценка возможностей её использования. Влияние идей ученого на развитие теории информационно-поисковых языков.
курсовая работа, добавлен 01.02.2016- 79. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Общая характеристика параллельной обработки данных на электронно-вычислительных машинах. Основы классификации вычислительных систем. Оценка классификации Кришнамарфи. Исследование особенностей использования параллелизма при компьютерной обработке данных.
лабораторная работа, добавлен 29.03.2016Рассмотрение проблемы классификации сообществ в социальной сети. Применение рекуррентных и сверточных нейронных сетей для классификации групп пользователей по степени радикальности. Методы предварительной обработки данных для построения классификаторов.
статья, добавлен 21.05.2021Сайт как совокупность логически связанных между собой веб-страниц; также место расположения контента сервера. Технико-экономическая характеристика предприятия. Создание системы авторизации и групп пользователей. Программное и техническое обеспечение.
дипломная работа, добавлен 25.05.2015Реализация информатизации в российских судах общей юрисдикции происходит с помощью Государственной автоматизированной программы РФ "Правосудие". Ручное занесение самого дела в одну из выделенных при классификации групп, после выполнения его изучения.
статья, добавлен 26.07.2018Исследование и разработка моделей, методов и средств совершенствования качества функционирования информационных систем. Разработка системы дескриптивной, математической и физической модели показателей качества и алгоритма исправления ошибок в задачах ИС.
автореферат, добавлен 13.02.2018Способы ускорения процессов разработки и тестирования программного обеспечения с целью повышения качества выдаваемого продукта. Обнаружение разнообразных дефектов и слабых мест исходного кода. Исследование безопасности, поиск уязвимостей и ошибок.
статья, добавлен 03.05.2019Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019Алгоритм классификации по запросу. Анализ формальных понятий. Алгоритм ленивой классификации с помощью узорных структур. Модификация рандомизации алгоритма. Модификация с предварительным расчетом гипотез. Оценка возможности визуализации гипотез.
дипломная работа, добавлен 04.08.2018Актуальность сетевой безопасности. Использование протоколов TSP/IP для заполнения контента, угрозы и их следствия. Применение брандмауэров, фильтрующих пакеты и их использование. Анализ эффективности использование ОС Linux в анализе и защите контента.
курсовая работа, добавлен 06.02.2012Характеристика особенностей сбора данных с помощью коммуникационной технологии Wi-Fi. Описание и реализация алгоритма бинарного дерева решений "Дерево Классификации и регрессии". Классификация посетителей, на основании их перемещения по помещениям.
статья, добавлен 25.12.2016Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Изучение функции "поиска подобных документов" как способа повышения качества информационного поиска в полнотекстовых базах. Алгоритм определения степени семантического сходства текста с эталоном. Схема оценки текстов на семантическое сходство с эталоном.
статья, добавлен 25.08.2020Изучение технологии решения задач интеллектуального анализа данных. Определение типа вина, обнаружение кишечной палочки методами "нейронная сеть", "байесовский классификатор", "линейная регрессия", "деревья принятия решений"," k-ближайших соседей".
практическая работа, добавлен 08.05.2017Принципы построения сетей доставки контента и конкурирующих с ними многочисленных пиринговых (одноранговых) сетей (Peer-to-Peer, P2P). Математическая модель управления ресурсами гибридной сети доставки контента с гарантированным качеством обслуживания.
статья, добавлен 19.06.2018Построение модели представления контента образовательных электронных изданий, позволяющей отражать семантическую структуру учебной информации. Разработка инструментального программного учебного комплекса с широким спектром функциональных возможностей.
автореферат, добавлен 09.09.2012Характеристика схемы объединения компьютеров предприятия в сеть. Технологии хранения данных. Методы защиты компьютеров от несанкционированного доступа, заражения вирусами и спама. Правила техники безопасности и внутреннего распорядка предприятия.
отчет по практике, добавлен 11.01.2018Поиск дубликатов и плагиата среди веб-страниц, как одно из главных направлений сравнения текстов. Алгоритм шинглов, как один из эффективных алгоритмов определения сходства документов на предмет заимствования. Удаление частично измененного копипаста.
статья, добавлен 19.02.2019Требования к функционалу программной реализации, предварительная обработка текстовых данных. Программная реализация, описание логической структуры. Зависимость качества от числа авторов и от объёма текстов. Особенности и значение индексации документов.
курсовая работа, добавлен 05.08.2018Ознакомление с организацией "ОМВД России" в г. Агидель. Управление медиатекой цифровой информации. Публикация мультимедиа контента в Интернете. Тиражирование мультимедиа контента на съемных носителях информации. Обеспечение информационной безопасности.
отчет по практике, добавлен 19.04.2022Исследование влияния искусственного интеллекта на разработку компьютерных игр. Генерация контента для персонажей. Различные результаты исследований, которые сфокусированы на создании лица, голоса и движения игровых персонажей. Создание карт, уровней.
статья, добавлен 25.01.2021Рассмотрение классификации основных угроз информационной безопасности. Изучение основных методов и средств обеспечения безопасности компьютерной информации и вычислительных систем. Характеристика основных типов криптосистем и методов шифрования.
дипломная работа, добавлен 27.10.2018