Технология автоматической рубрикации текстов с использованием тезауруса для автоматического концептуального индексирования
Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
Подобные документы
Проект системы поддержки принятия решений для рубрикации научных текстов с учетом их особенностей. Исследование искусственных нейронных сетей, логистической регрессии. Анализ данных, извлечение признаков из текстов, разработка настольного приложения.
дипломная работа, добавлен 02.09.2018Современные технологии обработки естественного языка. Применение интернет ресурсов и искусственного интеллекта для обработки лингвистической информации. Преимущества эмбеддинговых моделей при классификации текстов. Методы распознавания и синтеза речи.
статья, добавлен 16.07.2021Бинарная классификация тональности русскоязычных текстов, основные подходы к ее анализу и извлечению синтаксических зависимостей в предложениях. Разработка Python-библиотека для бинарной классификации эмоциональной окраски русскоязычных текстов.
дипломная работа, добавлен 30.08.2016Сравнение статистики, машинного обучения и Data Mining, методы ее применяемые для решения задач классификации, способы классификации и прогнозирования в процессе решения бизнес-задач, прикладное программное обеспечение для работы с нейронными сетями.
книга, добавлен 09.09.2012Описана информационная технология машинного обучения для выявления обфусцированных текстов, которыми обмениваются участники виртуальных социальных сетей при ведении ими противоправной деятельности. Эффективность использования рассматриваемой технологии.
статья, добавлен 01.02.2019Разработка и анализ работы алгоритмов для анализа тональности агрессивных комментариев, автоматического определения их эмоционального окраса. Реализация классифицирующих моделей машинного обучения, оценка их качества и сравнение их эффективности.
дипломная работа, добавлен 10.12.2019Рассмотрение лексико-фразеологических и дискурсивных особенностей текстов научно-технического стиля, которые следует учитывать при разработке процедур автоматической обработки текстов. Описание элементов и языка записи шаблонов, методики их разработки.
реферат, добавлен 16.01.2018Применение интеллектуальных средств защиты информации в системах обнаружения атак. Задачи классификации в экспертных системах. Вероятностные методы решения задачи классификации. Применение нейронных сетей в задачах классификации и кластеризации.
статья, добавлен 23.03.2018Описание идеи, методологии и текущего состояния проекта по созданию лингвистической онтологии – специального информационно-поискового тезауруса для автоматической обработки текстов по естественным наукам. Характеристика подходов к разработке ее ресурсов.
статья, добавлен 16.01.2018Общая характеристика статьи, описывающей алгоритм рекомендации перемещения метода с помощью машинного обучения. Рассмотрение основных особенностей применения методов машинного обучения для автоматической рекомендации рефакторинга "перемещение метода".
дипломная работа, добавлен 01.12.2019Обзор и классификация существующих систем машинного перевода. Состав логических блоков систем, история развития машинного перевода. Рассмотрение места системы машинного перевода "Кросслятор 2.0" среди современных систем автоматической обработки текстов.
статья, добавлен 28.10.2018Аналіз шляхів удосконалення технологій інформаційного пошуку за допомогою тезауруса предметної області. Характеристика особливостей алгоритму процедури інформаційного пошуку, дослідження технології формування тезауруса предметної області "Розумне місто".
статья, добавлен 18.05.2020Требования к информационно-поисковому языку (ИПЯ). Необходимость его создания и использования для обработки информации. Обобщенная структура тезауруса. Типы, виды и свойства ИПЯ. Классификационные и дескрипторные языки индексирования, их применение.
курсовая работа, добавлен 08.11.2013Описание алгоритма автоматического перевода текстов с одного языка на другой с использованием дерева модели мира. Перевод с помощью графа модели мира, активизация дерева на входном языке. Генерация осмысленных текстов с помощью дерева модели мира.
статья, добавлен 19.12.2021Компьютерная лингвистика как область знаний, связанная с решением задач автоматической обработки информации, представленной на естественном языке. Основные типы корпусов текстов. Анализ достоинств и недостатков автоматизированного машинного перевода.
реферат, добавлен 24.02.2014Понятие машинного перевода как процесса перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Место машинного перевода в общей классификации, его краткая характеристика.
реферат, добавлен 27.05.2014Рассмотрение машинного обучения для классификации комментариев в рамках курсового проекта по дисциплине "Machine Learning. Обучающиеся технические системы". Автоматическое определение эмоциональной окраски (позитивный, негативный) текстовых данных.
статья, добавлен 19.02.2019Перспективы нового программного приложения для редактирования текстов, имеющих общее происхождение. Адаптация аппарата теории нечетких множеств. Массовое сопоставление и анализ средневековых текстов с помощью алгоритмизированных математических методов.
статья, добавлен 08.04.2019Classification method of graphic and text area of the image. The principles and stages of construction of the narrative function characterizing the sizes of objects in the image, can be used for training and classification using support vector machines.
статья, добавлен 23.02.2016Особенности анализа структуры научных статей, анализ и описание информационного графа по матрице смежности. Характеристика графового метода определения структурированности текстов. Привлечение графовых моделей в системах автоматического анализа текстов.
статья, добавлен 14.11.2020Алгоритмы для решения задачи бинарной классификации. Подготовка данных для создания модели. Разработка предиктивной модели для прогнозирования возможности продажи дополнительных услуг телекоммуникационного оператора с целью решения маркетинговых задач.
дипломная работа, добавлен 27.08.2018Лингвистические особенности организации ФИС (формулы изобретения на способ). Возможности переиспользования интерфейса системы автоматического синтеза формулы изобретения для определения запроса к системе автоматического поиска патентных текстов.
автореферат, добавлен 30.04.2018Описание подходов к упорядочению текстов выдачи поисковой системы по близости к запросу с использованием модели машинного обучения, основанной на сравнении деревьев синтаксического разбора. Результаты использования выборки запросов на английском языке.
статья, добавлен 19.01.2018- 24. Программная система для автоматической генерации интеллектуальных технологий анализа данных IT-PEGAS
Функциональные возможности и группы методов для решения задач в системе IT-PEGAS. Методы автоматического проектирования нейросетевых технологий и их коллективов. Программная система для решения ряда практических задач моделирования и прогнозирования.
статья, добавлен 19.01.2018 Особенности постановки классической транспортной задачи и трех способов ее решения. Аспекты вырождения в задачах линейного программирования. Примеры составления первого допустимого плана перевозок. Решение задач с дополнительными условиями, их критерии.
реферат, добавлен 20.11.2009