Кластеризация языковых выражений в корпусе текстов на основе стохастического ранжирования

Решение задач автоматической кластеризации новостных документов, расстановка списка тематических меток для всех классов. Тематические метки и ключевые слова, биграммные конструкции. Кластеризация, грамматика конструкций, эксперимент, соответствующий цели.

Подобные документы

  • Характеристика метода формирования и анализа платёжной матрицы. Исследование процесса группового принятия решения с помощью кластеризации экспертных оценок альтернатив. Обзор языков программирования. Определение надежности программного обеспечения.

    дипломная работа, добавлен 14.03.2016

  • Необходимость классификации и кодирования экономической информации, их особенности и методы. Сущность понятий классификации и кластеризации. Свойства, требования и порядок построения иерархической и фасетной систем. Виды отношений между дескрипторами.

    презентация, добавлен 07.09.2015

  • Значение понятия "скрытые знания". Определение сути методов Data mining. Язык запросов к базам данных. Выявление возможностей для создания, изменения и извлечения хранимых данных. Data mining и искусственный интеллект. Задачи кластеризации и ассоциации.

    контрольная работа, добавлен 14.04.2014

  • Обобщенная архитектура системы поддержки принятия решений. Особенности технологии реляционного хранения данных. Представление информации в виде гиперкуба. Графическая иллюстрация задачи кластеризации. Описание математических основ бизнес-аналитики.

    дипломная работа, добавлен 09.06.2014

  • Обоснование метода формирования доменов, основанного на кластеризации матрицы связей. Вклады различных динамик в глубину локального минимума. Ослабление связей внутри сильно связанных спиновых групп. Хеббовская матрица специального вида, ее применение.

    статья, добавлен 08.02.2013

  • Анализ методов предварительной обработки текстовых сообщений, способов классификации и кластеризации. Программы определения тональности текста. Представление текста в виде дерева синтаксического разбора. Разработка системы анализа текстовой информации.

    магистерская работа, добавлен 09.07.2016

  • Оценка и анализ эксплуатационных качеств дизельных двигателей в условиях финансовых (массо-габаритных) ограничений на эксплуатацию. Алгоритм подбора оборудования по значимым параметрам двигателя. Построение нечеткой модели выбора (нечеткой кластеризации).

    статья, добавлен 28.04.2017

  • Начальное формирование данных обо всех словах в виде списка. Поиск заданного слова в словаре и печать его толкования. Поиск синонимов – слов с одинаковыми значениями на русском языке и подсчет их количества. Описание классов и их программная реализация.

    курсовая работа, добавлен 16.12.2012

  • Цели создания и задачи системы автоматизированного проектирования. Требования к техническим средствам САПР. Подходы к проектированию на основе компьютерных технологий: оформление конструкторских и текстовых документов, решение геометрических задач.

    статья, добавлен 26.04.2019

  • Ручной подбор схемы взвешивания для коллекции документов. Вычисление полноты, точности и аккуратности алгоритма. Основные преимущества и недостатки модификации с генетическим алгоритмом. Эффективность использования векторной модели для ранжирования.

    статья, добавлен 30.05.2017

  • Понятия символьной информации и систем управления реляционными базами информации. Технология программирования предметной области информационных баз данных и концептуальное описание их предметной области. Кластеризация документов и экспертных систем.

    дипломная работа, добавлен 22.09.2013

  • Моделирование как один из распространенных методов решения задач. Описание применения метода стохастического моделирования для решения социально-экономических задач в программе GPSS World. Признаки стохастического моделирования: дискретное время и др.

    статья, добавлен 26.04.2019

  • Технология обработки документов средствами табличного процессора Excel. Решение линейных и нелинейных задач. Решение задач математического программирования. Математическая система автоматизированного проектирования. Матрицы и системы линейных уравнений.

    контрольная работа, добавлен 17.11.2015

  • Определение нейронных сетей методом Давидона-Флетчера-Пауэлла. Расчет с индивидуальными данными начальной точки для негладких функций. Кластеризация данных на основе графовых моделей и статистических методов с индивидуальным заданием точек наблюдения.

    контрольная работа, добавлен 26.02.2015

  • Задачи и этапы кластерного анализа. Цели кластеризации для выработки рекомендаций. Сравнительный анализ иерархических и неиерархических методов кластеризации. Обзор существующих систем кластеризации, сеточные алгоритмы. Выбор языка программирования.

    дипломная работа, добавлен 21.05.2016

  • Изучение средств работы с диаграммой классов и создание прототипа кода на языке С++, предоставляемых системой Enterprise Architect. Произведение автоматической генерации прототипа кода разработанных классов. Решение задачи в системе Enterprise Architect.

    контрольная работа, добавлен 11.11.2017

  • Исследование и анализ процесса организации интеллектуального репозитария электронной документации. Ознакомление с теоретическими аспектами кластеризации на основе нейронных сетей. Рассмотрение и характеристика структуры данных кластеризации Кохонена.

    статья, добавлен 18.01.2018

  • Появление языка XML в качестве нового стандарта для представления электронных документов. Применение языка для запросов к БД на основе взаимосвязанных (распределенных по глобальной сети) XML-документов. Синтаксис и семантика конструкций языка XML.

    статья, добавлен 17.01.2018

  • Дескриптивные и оптимизационные задачи прикладной математики. Роль компьютера в современном мире. Общая характеристика задач стохастического программирования. Правила охраны труда при работе на персональном компьютере, его экономическая эффективность.

    курсовая работа, добавлен 04.11.2010

  • Важнейшие этапы решения основных задач экологии. Команды, ключевые слова и синтаксические конструкции алгоритмического кода. Процедура рисования графика. Использование графиков в среде Netlogo. Отражение поведения и взаимоотношений исследуемых агентов.

    статья, добавлен 17.07.2018

  • Исследование процесса ранжирования документов по критериям релевантности запросу. Повышение достоверности информационно-поисковых систем на этапе предварительного отбора тестовых документов, содержащих формальные признаки наличия интересующей информации.

    автореферат, добавлен 02.05.2018

  • Варианты классификации, рубрицирование текстов. Методы машинного обучения в задачах рубрикации. Оптимальный линейный сепаратор Support Vector Machines. Документы из Reuters-21548. Применение тезауруса для решения сложных задач. Расчет веса конъюнкции.

    лекция, добавлен 19.10.2013

  • Создание документов в редакторе MS Word, изменение шрифта. Обтекание рисунка текстом. Сетевые технологии обработки информации, работа с таблицами и рисование в документе. Создание списка, оформление абзацев документов, текстовые файлы на основе шаблонов.

    учебное пособие, добавлен 27.09.2014

  • Создание математической модели системы автоматического ранжирования сайтов в поисковых системах в зависимости от запросов пользователей. Исследование сетей в сети Интернет. Совершенствование алгоритмов, на основе которых работают поисковые системы.

    статья, добавлен 28.07.2017

  • Принцип коммутации и маршрутизации сети. Понятие метки и способы маркировки. Компоненты коммутируемого маршрута по протоколу LDP. Привязка и распределение меток. Построение коммутируемого маршрута, развертывание MPLS. Преимущества технологии MPLS.

    статья, добавлен 08.04.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.