Технология автоматической рубрикации текстов с использованием тезауруса для автоматического концептуального индексирования
Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
Подобные документы
Особенности построения множества предпочтительных дескрипторов и концептов. Тезаурус как библиотека с набором словарей синонимов, антонимов, родственных слов и родовидовых связей. Способы создания электронного тезауруса по дисциплине "Компьютерные сети".
курсовая работа, добавлен 18.05.2015Система, разработанная для автоматического поиска и выделения в тексте на русском языке конструкций по их описанию в виде лексико-синтаксических шаблонов языка LSPL. Применение системы для решения различных прикладных задач, требующих анализа ЕЯ-текстов.
статья, добавлен 19.01.2018Характеристика основных процессов преобразования информации. Жизненный цикл информационных теорий. Технология обработки данных в документальных информационно-поисковых системах. Главные методы автоматического рубрицирования, основанные на знаниях.
курс лекций, добавлен 12.03.2015Решение задачи классификации переводов клиентов банка на легальные и мошеннические с использованием средств машинного обучения. Обнаружение мошеннических транзакций средствами машинного обучения. Решение задачи построения ансамбля классификаторов.
дипломная работа, добавлен 18.07.2020- 30. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Общая задача линейного программирования, применение её для решения различных типов вычислительных задач. Применение процессора Microsoft Excel для расчета задач линейного программирования. Нахождение начального опорного решения. Алгоритмы и их описание.
курсовая работа, добавлен 23.01.2014Изучение методов решения логически сложных задач по программированию. Эвристические методы в задачах перебора. Моделирование физических процессов. Структурная единица программы на языке С++. Расчёт факториала. Наиболее часто используемые типы данных.
методичка, добавлен 23.05.2012Исследование методов одномерного поиска и влияния параметров алгоритмов на их эффективность. Анализ особенностей решения задач оптимизации с использованием методов многомерной и условной оптимизации. Особенности решения задач линейного программирования.
методичка, добавлен 21.10.2015Сущность метода динамического линейного программирования. Особенности решения задач с использованием возможностей табличного процессора MS Excel. Принцип работы и функции файловой среды, характеристика решения двойственной задачи с применением формул.
курсовая работа, добавлен 20.06.2015Исследование задачи машинного обучения. Распознавание на изображении образа кошки. Пример распознавания лиц на Facebook. Пример простейшей схемы нейросети. Пример отображения некоторых архитектур нейросетей. Анализ программ-поисковиков в Интернете.
статья, добавлен 13.03.2019Анализ рубрикации открытых Интернет-сервисов рейтинговой статистики. Изучение методики, позволяющей разработать модель, сводящую систему взаимосвязанных и соподчиненных заголовков издания нескольких ресурсов. Применение концепции на практическом примере.
статья, добавлен 16.07.2018Метод построения систем смыслопорождения на основе парадигмы предельных обобщений. Создание банка конфигураторов текстов и прецедентов. Разработка иерархии конфигураторов текстов для задач мониторинга. Мониторинг состояния сложных систем и процессов.
статья, добавлен 30.08.2016Ускорение обработки огромных информационных массивов как одна из основных целей методики обнаружения вредоносного трафика с использованием анализа данных. Особенности настройки гиперпараметров алгоритма, который реализует метод машинного обучения.
статья, добавлен 18.01.2021Методы решения систем линейных уравнений. Разработка классов функций Matrix и Vector для решения простейших задач линейной алгебры, написание алгоритмов на языке Borland C++ для данных классов и ошибки, которые могут возникнуть при их использовании.
курсовая работа, добавлен 25.09.2014Построение формализованного представления области "Анализ изображений". Разработка метода использования тезаурусов и онтологий при решении задач анализа изображений. Применение математических методов распознавания образов, структурной лингвистики.
автореферат, добавлен 31.07.2018- 41. Организация работы торгового предприятия, реализующего программное обеспечение для перевода текстов
Проблема автоматического перевода текстов, особенности программного обеспечения этого процесса. Программы для орфографической проверки текста. Программные продукты в области лингвистики, семантики, электронной лексикографии и специфика их использования.
контрольная работа, добавлен 26.04.2013 Основные понятия и существующие алгоритмы машинного обучения, особенности их применения в информационных системах. Подходы к обработке естественного языка. Вызовы и ограничения применения машинного обучения в информационных системах, его перспективы.
курсовая работа, добавлен 20.05.2023Решение систем линейных уравнений формулами Жордана-Гаусса. Графический и симплексный методы для задач линейного программирования. Технология решения с помощью поиска решений в среде EXCEL. Характеристика двойственности и анализ оптимальных решений.
лабораторная работа, добавлен 03.12.2012Увеличение скорости работы метапоисковой системы, изучение интерфейса пользователя. Применение метода отбора релевантных результатов с помощью тезауруса. Определение пропускной способности сетевой карты узла. Анализ работы брокерами с базами данных.
статья, добавлен 26.03.2016Мониторинг работы сердца, возможность своевременного обнаружения патологий в его работе как одни из главных задач современной медицины. Три варианта анализа классификации для повышения устойчивости алгоритма к потерям каких-либо составляющих ЭКГ-сигнала.
статья, добавлен 14.12.2021Реализация технологии решения задачи с использованием электронного табличного процессора. Описание средств электронной таблицы MS Excel для проведения экономических расчетов. Проверка решения аналитическим способом. Применение математических зависимостей.
контрольная работа, добавлен 17.08.2013История развития вычислительной техники. Появление в конце 50-х годов языков программирования высокого уровня. Применение ЭВМ для решения задач искусственного интеллекта и обработки текстов. Работы по организации процесса тестирования. Книга Брукса.
реферат, добавлен 21.11.2013История возникновения и развития компьютерной лингвистики. Инструменты анализа корпусов текстов. Системы и средства корпусного анализа. Факторный анализ соответствий корпуса противоправных текстов. Анализ специфичности корпуса противоправных текстов.
дипломная работа, добавлен 10.12.2019Методы поиска правила, определяющего оптимальный выбор стратегии лечения, которые не нуждаются в определении расстояния между пациентами. Программные реализации рассматриваемых методов на языке Matlab. Персонализированное лечение лимфобластного лейкоза.
курсовая работа, добавлен 23.07.2016Обучение морфологического анализатора на основе искусственных нейронных сетей для разметки Санкт-Петербургского корпуса агиографических текстов. Опыт использования нейросетевой модели с языковым переносом для частеречной разметки древнерусских текстов.
статья, добавлен 03.03.2024