Технология автоматической рубрикации текстов с использованием тезауруса для автоматического концептуального индексирования

Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.

Подобные документы

  • Особенности постановки классической транспортной задачи и трех способов ее решения. Аспекты вырождения в задачах линейного программирования. Примеры составления первого допустимого плана перевозок. Решение задач с дополнительными условиями, их критерии.

    реферат, добавлен 20.11.2009

  • Особенности построения множества предпочтительных дескрипторов и концептов. Тезаурус как библиотека с набором словарей синонимов, антонимов, родственных слов и родовидовых связей. Способы создания электронного тезауруса по дисциплине "Компьютерные сети".

    курсовая работа, добавлен 18.05.2015

  • Система, разработанная для автоматического поиска и выделения в тексте на русском языке конструкций по их описанию в виде лексико-синтаксических шаблонов языка LSPL. Применение системы для решения различных прикладных задач, требующих анализа ЕЯ-текстов.

    статья, добавлен 19.01.2018

  • Характеристика основных процессов преобразования информации. Жизненный цикл информационных теорий. Технология обработки данных в документальных информационно-поисковых системах. Главные методы автоматического рубрицирования, основанные на знаниях.

    курс лекций, добавлен 12.03.2015

  • Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.

    диссертация, добавлен 28.12.2013

  • Решение задачи классификации переводов клиентов банка на легальные и мошеннические с использованием средств машинного обучения. Обнаружение мошеннических транзакций средствами машинного обучения. Решение задачи построения ансамбля классификаторов.

    дипломная работа, добавлен 18.07.2020

  • Общая задача линейного программирования, применение её для решения различных типов вычислительных задач. Применение процессора Microsoft Excel для расчета задач линейного программирования. Нахождение начального опорного решения. Алгоритмы и их описание.

    курсовая работа, добавлен 23.01.2014

  • Изучение методов решения логически сложных задач по программированию. Эвристические методы в задачах перебора. Моделирование физических процессов. Структурная единица программы на языке С++. Расчёт факториала. Наиболее часто используемые типы данных.

    методичка, добавлен 23.05.2012

  • Исследование методов одномерного поиска и влияния параметров алгоритмов на их эффективность. Анализ особенностей решения задач оптимизации с использованием методов многомерной и условной оптимизации. Особенности решения задач линейного программирования.

    методичка, добавлен 21.10.2015

  • Сущность метода динамического линейного программирования. Особенности решения задач с использованием возможностей табличного процессора MS Excel. Принцип работы и функции файловой среды, характеристика решения двойственной задачи с применением формул.

    курсовая работа, добавлен 20.06.2015

  • Исследование задачи машинного обучения. Распознавание на изображении образа кошки. Пример распознавания лиц на Facebook. Пример простейшей схемы нейросети. Пример отображения некоторых архитектур нейросетей. Анализ программ-поисковиков в Интернете.

    статья, добавлен 13.03.2019

  • Анализ рубрикации открытых Интернет-сервисов рейтинговой статистики. Изучение методики, позволяющей разработать модель, сводящую систему взаимосвязанных и соподчиненных заголовков издания нескольких ресурсов. Применение концепции на практическом примере.

    статья, добавлен 16.07.2018

  • Метод построения систем смыслопорождения на основе парадигмы предельных обобщений. Создание банка конфигураторов текстов и прецедентов. Разработка иерархии конфигураторов текстов для задач мониторинга. Мониторинг состояния сложных систем и процессов.

    статья, добавлен 30.08.2016

  • Ускорение обработки огромных информационных массивов как одна из основных целей методики обнаружения вредоносного трафика с использованием анализа данных. Особенности настройки гиперпараметров алгоритма, который реализует метод машинного обучения.

    статья, добавлен 18.01.2021

  • Методы решения систем линейных уравнений. Разработка классов функций Matrix и Vector для решения простейших задач линейной алгебры, написание алгоритмов на языке Borland C++ для данных классов и ошибки, которые могут возникнуть при их использовании.

    курсовая работа, добавлен 25.09.2014

  • Построение формализованного представления области "Анализ изображений". Разработка метода использования тезаурусов и онтологий при решении задач анализа изображений. Применение математических методов распознавания образов, структурной лингвистики.

    автореферат, добавлен 31.07.2018

  • Проблема автоматического перевода текстов, особенности программного обеспечения этого процесса. Программы для орфографической проверки текста. Программные продукты в области лингвистики, семантики, электронной лексикографии и специфика их использования.

    контрольная работа, добавлен 26.04.2013

  • Основные понятия и существующие алгоритмы машинного обучения, особенности их применения в информационных системах. Подходы к обработке естественного языка. Вызовы и ограничения применения машинного обучения в информационных системах, его перспективы.

    курсовая работа, добавлен 20.05.2023

  • Решение систем линейных уравнений формулами Жордана-Гаусса. Графический и симплексный методы для задач линейного программирования. Технология решения с помощью поиска решений в среде EXCEL. Характеристика двойственности и анализ оптимальных решений.

    лабораторная работа, добавлен 03.12.2012

  • Увеличение скорости работы метапоисковой системы, изучение интерфейса пользователя. Применение метода отбора релевантных результатов с помощью тезауруса. Определение пропускной способности сетевой карты узла. Анализ работы брокерами с базами данных.

    статья, добавлен 26.03.2016

  • Мониторинг работы сердца, возможность своевременного обнаружения патологий в его работе как одни из главных задач современной медицины. Три варианта анализа классификации для повышения устойчивости алгоритма к потерям каких-либо составляющих ЭКГ-сигнала.

    статья, добавлен 14.12.2021

  • Реализация технологии решения задачи с использованием электронного табличного процессора. Описание средств электронной таблицы MS Excel для проведения экономических расчетов. Проверка решения аналитическим способом. Применение математических зависимостей.

    контрольная работа, добавлен 17.08.2013

  • История развития вычислительной техники. Появление в конце 50-х годов языков программирования высокого уровня. Применение ЭВМ для решения задач искусственного интеллекта и обработки текстов. Работы по организации процесса тестирования. Книга Брукса.

    реферат, добавлен 21.11.2013

  • История возникновения и развития компьютерной лингвистики. Инструменты анализа корпусов текстов. Системы и средства корпусного анализа. Факторный анализ соответствий корпуса противоправных текстов. Анализ специфичности корпуса противоправных текстов.

    дипломная работа, добавлен 10.12.2019

  • Обучение морфологического анализатора на основе искусственных нейронных сетей для разметки Санкт-Петербургского корпуса агиографических текстов. Опыт использования нейросетевой модели с языковым переносом для частеречной разметки древнерусских текстов.

    статья, добавлен 03.03.2024

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.