Кластеризация языковых выражений в корпусе текстов на основе стохастического ранжирования
Решение задач автоматической кластеризации новостных документов, расстановка списка тематических меток для всех классов. Тематические метки и ключевые слова, биграммные конструкции. Кластеризация, грамматика конструкций, эксперимент, соответствующий цели.
Подобные документы
Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.
лекция, добавлен 19.10.2013Создание документов в редакторе MS Word, изменение шрифта. Обтекание рисунка текстом. Сетевые технологии обработки информации, работа с таблицами и рисование в документе. Создание списка, оформление абзацев документов, текстовые файлы на основе шаблонов.
учебное пособие, добавлен 27.09.2014Создание математической модели системы автоматического ранжирования сайтов в поисковых системах в зависимости от запросов пользователей. Исследование сетей в сети Интернет. Совершенствование алгоритмов, на основе которых работают поисковые системы.
статья, добавлен 28.07.2017Разработка базы данных. Решение информационно-поисковых задач на основе массива строк. Решение информационно-поисковых задач на основе управления базами данных. Защита от несанкционированного доступа. Ограничение доступа к базе данных с помощью паролей.
курсовая работа, добавлен 15.12.2016- 80. Протокол MPLS
Принцип коммутации и маршрутизации сети. Понятие метки и способы маркировки. Компоненты коммутируемого маршрута по протоколу LDP. Привязка и распределение меток. Построение коммутируемого маршрута, развертывание MPLS. Преимущества технологии MPLS.
статья, добавлен 08.04.2015 Построение оптимальной системы принятия решений задач многомерной регрессии. Обоснование целесообразности решения задачи автоматизации процедур, обеспечивающих распознавание классов в реальном времени, в нейросетевом формате в среде нейроэмуляторов.
статья, добавлен 30.05.2017Повышение качества и сложности создаваемых автоматизированных устройств и систем в различных областях науки и техники. Построение временного графика производственного процесса на основе нечеткого генетического алгоритма. Решение задачи коммивояжера.
статья, добавлен 19.01.2018Выявление аномалий в процессах и проведение проверки соответствия модели и журналов событий. Метод проверки соответствия с учетом специфики процесса и последующая кластеризация данных. Разработка приложения для выявления аномалий в журналах событий.
дипломная работа, добавлен 01.12.2019Решение различных задач по содержанию и отраслевому значению. Характеристика программного обеспечения как изделие. Постановка основных целей и определение их значения. Рассмотрение содержания документов "Соглашение о требованиях" и "Постановка задачи".
реферат, добавлен 06.12.2014Рассмотрение лексико-фразеологических и дискурсивных особенностей текстов научно-технического стиля, которые следует учитывать при разработке процедур автоматической обработки текстов. Описание элементов и языка записи шаблонов, методики их разработки.
реферат, добавлен 16.01.2018Характеристика организации априорной модели, позволяющей на высоком концептуальном уровне описывать как данные, так и схемы в реляционных базах. Разработка механизмов автоматической детализации модели путем сканирования естественно-языковых текстов.
статья, добавлен 16.01.2018Метод построения систем смыслопорождения на основе парадигмы предельных обобщений. Создание банка конфигураторов текстов и прецедентов. Разработка иерархии конфигураторов текстов для задач мониторинга. Мониторинг состояния сложных систем и процессов.
статья, добавлен 30.08.2016Система, разработанная для автоматического поиска и выделения в тексте на русском языке конструкций по их описанию в виде лексико-синтаксических шаблонов языка LSPL. Применение системы для решения различных прикладных задач, требующих анализа ЕЯ-текстов.
статья, добавлен 19.01.2018Основные определения и понятия теории графов. Оптимизация решения задач с применением эволюционно-генетического подхода. Повышение технологичности и простоты конструктивного оформления элементов принципиальных схем на основе генетических алгоритмов.
курсовая работа, добавлен 28.02.2018Предложение по решению задачи индексирования больших массивов информации. Особенности применения нейронной сети для точного ранжирования документов, имеющих шанс оказаться на высоких местах в выдаче по результатам более грубой оценки их релевантности.
статья, добавлен 26.04.2017Статические элементы. Ключевые слова this, super, abstract. Интерфейсы: объявление, реализация, применение. Правила объявления классов с учетом их наследования. Полиморфизм: поля, методы, объекты. Взаимосвязи типа переменной и типов ее возможных значений.
лекция, добавлен 05.01.2014Изучение специфики использования сетевого анализа в исторических исследованиях, которая выражается в постановке задач, структуре источников и методов их анализа. Выявление сетей индивидуумов на основе корпуса исторических текстов (типа эго-документов).
статья, добавлен 08.04.2019Особенности научных статей, представленных в формате PDF. Разработка классов для системы автоматической разметки. Выбор программного обеспечения для реализации и обучения нейронной сети. Алгоритмы сортировки блоков в соответствии с иерархией документа.
дипломная работа, добавлен 13.07.2020Краткая характеристика программных способов нахождения кода в документах, таких как метод регулярных выражений, поиск конструкций языка по их местоположению в тексте, построчный анализ текста по ключевым словам и с подсчетом их количества в каждой строке.
статья, добавлен 18.12.2017Компьютерная лингвистика как область знаний, связанная с решением задач автоматической обработки информации, представленной на естественном языке. Основные типы корпусов текстов. Анализ достоинств и недостатков автоматизированного машинного перевода.
реферат, добавлен 24.02.2014Рассмотрение задачи фильтрации спама и наиболее распространенных подходов к ее решению в сравнении с методами искусственного интеллекта. Развитие средств защиты от спама. Решение задачи защиты от спама на основе списка адресов, сигнатур, теоремы Байеса.
статья, добавлен 19.05.2018Назначение мультипроцессорных вычислительных систем. Схема параллельных алгоритмов. Закон Амдала. Классы параллельных архитектур. PVP Parallel Vector Process. Мультипроцессоры UMA и кластеризация. Сетевая архитектура MPP Massive Parallel Processing.
презентация, добавлен 14.12.2013Бизнес-процессы системы автоматической генерации онтологических моделей на основе структурированного текста. Описание программной разработки системы в виде скриншотов и результаты оценки эффективности реализованных методов автоматического построения.
статья, добавлен 18.07.2018- 99. Программа решения задач стохастического программирования с построчными вероятностными ограничениями
Задача стохастического программирования: их общая характеристика, особенности методов решения (с построчными вероятностными ограничениями и Келли). Описание алгоритма работы программы. Программный продукт: описание, специфика применения, тестирование.
курсовая работа, добавлен 08.11.2009 Дейтаграммный способ передачи пакетов между узлами составной сети. Разделение IPадреса на номер сети и номер узла на основе классов. Деление блоков адресов на части с помощью маски. Правила выделения адресных блоков. Принципы статической маршрутизации.
учебное пособие, добавлен 20.05.2014