Технология автоматической рубрикации текстов с использованием тезауруса для автоматического концептуального индексирования
Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
Подобные документы
Support Vector Machine (SVM). Optimization problem (mainly Quadratic Programming). Interior Point Method. Mainstream methods to solve Quadratic Programming problem. Incomplete Cholesky factorization and Kronecker factorization. Reform SVM training.
статья, добавлен 30.08.2016Существующие методы аугментации тренировочных данных в задаче классификации, их сравнительная характеристика и особенности применения. Порядок проведения экспериментов по аугментированию с помощью различных подходов. Их сравнение с методом EDA.
дипломная работа, добавлен 20.08.2020Methods for graphic and text image region classification. Construction of the narrative function characterizing areas of the image sub-elements is proposed. This function can be used for training and classification using support vector machines.
статья, добавлен 23.02.2016Компьютерное моделирование человеческой способности к порождению высказываний как цель порождения текстов на естественном языке. Условия разнопланового развития и творческого потенциала в порождении текстов. Формализация представления грамматики языка.
статья, добавлен 22.01.2016Технология создания интеллектуальных обучающих систем, ориентированных на знания. Приобретение знаний с использованием метода формального концептуального анализа. Построение вопросов, используемых для верификации знаний ученика со знаниями специалиста.
статья, добавлен 17.01.2018Изучение решения задач идентификации с использованием выражений алгебры событий и недетерминированных автоматов. Методика проектирования параллельных алгоритмов. Выбор модели программной и аппаратной реализации вычислений элементарных задач анализа.
учебное пособие, добавлен 13.01.2014Особенности составления и оформления текста отдельных видов и разновидностей документов. Наиболее употребляемые системы нумерации. Использование знаков разных типов. Принципы рубрикации текста работы. Основные требования к заголовкам и подзаголовкам.
эссе, добавлен 07.10.2013- 83. Разработка системы анализа стилистики синтаксических конструкций научных текстов на английском языке
Задача автоматизированного анализа стиля англоязычных текстов. Описание алгоритмов и библиотек для автоматизированного анализа текстов на английском языке. Реализация системы для анализа синтаксического стиля научных текстов на английском языке.
дипломная работа, добавлен 27.08.2018 Рассматриваются наиболее актуальные патентные решения в области интеграции машинного обучения в банковские системы противодействия мошенничеству (антифрод-системы). Приведены патентные решения российских, американских, китайских учёных и разработчиков.
статья, добавлен 01.04.2022Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
статья, добавлен 15.01.2019Сущность и предмет исследования, а также история развития компьютерной лингвистики. Особенности применения статистических методов в языкознании. Математический аппарат для исследования текстов на естественном языке, используемое программное обеспечение.
курсовая работа, добавлен 12.06.2016Решение задач автоматической кластеризации новостных документов, расстановка списка тематических меток для всех классов. Тематические метки и ключевые слова, биграммные конструкции. Кластеризация, грамматика конструкций, эксперимент, соответствующий цели.
дипломная работа, добавлен 29.10.2017Классификация систем индексирования. Реализация автоматического поиска с помощью прямого и инвертированного индексов. Структура полнотекстовой информационно-поисковой системы, механизм ее работы. Организация хранилища документов, виды глобального словаря.
презентация, добавлен 14.10.2013Изучение алгоритмов машинного обучения, направленных на выявление закономерностей в графических данных. Применение сверточных нейронных сетей при работе со спутниковыми изображениями. Создание интерактивной карты для визуализации распознанных объектов.
дипломная работа, добавлен 02.09.2018Методика разработки состязательных атак, которые основаны на словах и показывают возможность и силу изменения предсказываемого класса нейросети. Анализ особенностей применения регрессионных значений Шепли для интерпретации глубоких нейронных сетей.
дипломная работа, добавлен 28.11.2019Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Трудности, возникающие при решении информационно-сложных задач. Информационные технологии, которые ориентированы на их решение, перспективы и результаты ее практического применения. Методология проектирования и поддерживающая ее инструментальная база.
статья, добавлен 17.01.2018Возможности создания аннотированных библиографических проблемно-ориентированных баз данных на платформе АБИС ИРБИС с использованием тезауруса MeSH, который делает необязательным формирование отдельного тематического рубрикатора, то есть структуры.
статья, добавлен 21.09.2018Проблема выбора оптимального метода подбора персонифицированного лечения пациента. Исследование метода взвешенных исходов для анализа выживаемости на выборке пациентов с детским лимфобластным лейкозом. Применение данных для машинного обучения нейросети.
дипломная работа, добавлен 27.08.2016Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016Описание анализа систем распознавания эмоций с применением методов машинного обучения, находящихся в открытом доступе, в рамках курсового проекта по дисциплине Обучающие Технические Системы "Machine Learning". Neurobotics EmoDetect. Cognitive Emotion.
статья, добавлен 14.03.2019Практически важные задания по нахождению условного экстремума линейной функции. Математическая постановка задачи линейного целочисленного программирования. Расчет максимума функции при ограничениях по весу и объему. Методы целочисленной оптимизации.
курсовая работа, добавлен 26.01.2014Характеристика антагонистических, коалиционных, матричных видов игр. Ознакомление с содержанием и методами решения игровых задач с противодействием, природой и нулевой суммой. Способы сведения задач теории игр к задачам линейного программирования.
курсовая работа, добавлен 03.12.2013Решение задач анализа и синтеза систем автоматического регулирования с использованием обыкновенной линейной модели как одно из предназначений программного комплекса "Classic". Порядок задания передаточных функций звеньев и указания входного сигнала.
лабораторная работа, добавлен 25.05.2014Понятие и методы решения задач линейного программирования, этапы постановки его задач. Решение задачи на нахождение значения переменных, обеспечивающее минимизацию целевой функции, одноиндексной задачи и транспортной задачи с помощью средств MS Excel.
контрольная работа, добавлен 09.11.2014