Технология автоматической рубрикации текстов с использованием тезауруса для автоматического концептуального индексирования
Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
Подобные документы
Компьютерное моделирование человеческой способности к порождению высказываний как цель порождения текстов на естественном языке. Условия разнопланового развития и творческого потенциала в порождении текстов. Формализация представления грамматики языка.
статья, добавлен 22.01.2016Технология создания интеллектуальных обучающих систем, ориентированных на знания. Приобретение знаний с использованием метода формального концептуального анализа. Построение вопросов, используемых для верификации знаний ученика со знаниями специалиста.
статья, добавлен 17.01.2018Изучение решения задач идентификации с использованием выражений алгебры событий и недетерминированных автоматов. Методика проектирования параллельных алгоритмов. Выбор модели программной и аппаратной реализации вычислений элементарных задач анализа.
учебное пособие, добавлен 13.01.2014Рассматриваются наиболее актуальные патентные решения в области интеграции машинного обучения в банковские системы противодействия мошенничеству (антифрод-системы). Приведены патентные решения российских, американских, китайских учёных и разработчиков.
статья, добавлен 01.04.2022Особенности составления и оформления текста отдельных видов и разновидностей документов. Наиболее употребляемые системы нумерации. Использование знаков разных типов. Принципы рубрикации текста работы. Основные требования к заголовкам и подзаголовкам.
эссе, добавлен 07.10.2013- 81. Разработка системы анализа стилистики синтаксических конструкций научных текстов на английском языке
Задача автоматизированного анализа стиля англоязычных текстов. Описание алгоритмов и библиотек для автоматизированного анализа текстов на английском языке. Реализация системы для анализа синтаксического стиля научных текстов на английском языке.
дипломная работа, добавлен 27.08.2018 Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
статья, добавлен 15.01.2019Сущность и предмет исследования, а также история развития компьютерной лингвистики. Особенности применения статистических методов в языкознании. Математический аппарат для исследования текстов на естественном языке, используемое программное обеспечение.
курсовая работа, добавлен 12.06.2016Изучение алгоритмов машинного обучения, направленных на выявление закономерностей в графических данных. Применение сверточных нейронных сетей при работе со спутниковыми изображениями. Создание интерактивной карты для визуализации распознанных объектов.
дипломная работа, добавлен 02.09.2018Решение задач автоматической кластеризации новостных документов, расстановка списка тематических меток для всех классов. Тематические метки и ключевые слова, биграммные конструкции. Кластеризация, грамматика конструкций, эксперимент, соответствующий цели.
дипломная работа, добавлен 29.10.2017Классификация систем индексирования. Реализация автоматического поиска с помощью прямого и инвертированного индексов. Структура полнотекстовой информационно-поисковой системы, механизм ее работы. Организация хранилища документов, виды глобального словаря.
презентация, добавлен 14.10.2013Методика разработки состязательных атак, которые основаны на словах и показывают возможность и силу изменения предсказываемого класса нейросети. Анализ особенностей применения регрессионных значений Шепли для интерпретации глубоких нейронных сетей.
дипломная работа, добавлен 28.11.2019Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Трудности, возникающие при решении информационно-сложных задач. Информационные технологии, которые ориентированы на их решение, перспективы и результаты ее практического применения. Методология проектирования и поддерживающая ее инструментальная база.
статья, добавлен 17.01.2018Проблема выбора оптимального метода подбора персонифицированного лечения пациента. Исследование метода взвешенных исходов для анализа выживаемости на выборке пациентов с детским лимфобластным лейкозом. Применение данных для машинного обучения нейросети.
дипломная работа, добавлен 27.08.2016Возможности создания аннотированных библиографических проблемно-ориентированных баз данных на платформе АБИС ИРБИС с использованием тезауруса MeSH, который делает необязательным формирование отдельного тематического рубрикатора, то есть структуры.
статья, добавлен 21.09.2018Описание анализа систем распознавания эмоций с применением методов машинного обучения, находящихся в открытом доступе, в рамках курсового проекта по дисциплине Обучающие Технические Системы "Machine Learning". Neurobotics EmoDetect. Cognitive Emotion.
статья, добавлен 14.03.2019Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016Практически важные задания по нахождению условного экстремума линейной функции. Математическая постановка задачи линейного целочисленного программирования. Расчет максимума функции при ограничениях по весу и объему. Методы целочисленной оптимизации.
курсовая работа, добавлен 26.01.2014Характеристика антагонистических, коалиционных, матричных видов игр. Ознакомление с содержанием и методами решения игровых задач с противодействием, природой и нулевой суммой. Способы сведения задач теории игр к задачам линейного программирования.
курсовая работа, добавлен 03.12.2013Решение задач анализа и синтеза систем автоматического регулирования с использованием обыкновенной линейной модели как одно из предназначений программного комплекса "Classic". Порядок задания передаточных функций звеньев и указания входного сигнала.
лабораторная работа, добавлен 25.05.2014Понятие и методы решения задач линейного программирования, этапы постановки его задач. Решение задачи на нахождение значения переменных, обеспечивающее минимизацию целевой функции, одноиндексной задачи и транспортной задачи с помощью средств MS Excel.
контрольная работа, добавлен 09.11.2014Примеры задач компьютерного зрения. Методы машинного обучения. Модели нейронных сетей для задачи мульти-классификации и детектирования. Порядок создания системы детектирования и сегментирования предметов одежды на фото. Нейронные сети, модель SSD300.
статья, добавлен 18.07.2020Результаты реализации модуля программной системы для проведения лингвистических исследований. Хранение и получение текстов из корпусов с использованием индексации на основе естественно-языковой адресации в виде wcf-сервиса. Подход к хранению корпусов.
дипломная работа, добавлен 23.09.2018Иерархическая кластеризация информации в виде ключевых словосочетаний - традиционный подход к автоматическому построению таксономии. Характеристика основных подходов к решению задач, необходимых для проведения бикластерного анализа текстовых данных.
дипломная работа, добавлен 30.12.2015