Кластеризация языковых выражений в корпусе текстов на основе стохастического ранжирования

Решение задач автоматической кластеризации новостных документов, расстановка списка тематических меток для всех классов. Тематические метки и ключевые слова, биграммные конструкции. Кластеризация, грамматика конструкций, эксперимент, соответствующий цели.

Подобные документы

  • Определение понятия связного списка. Организация односвязного, двусвязного, односвязного циклического и двусвязного циклического списков. Описание логической структуры списков, особенности их элементов. Особенности продвижения данных в разных списках.

    курсовая работа, добавлен 16.09.2017

  • Структура, алгоритм работы и пример использования автоматизированной системы работы с клиентами. Возможность генерации документов практически любого вида на основе заданных шаблонов и меток. Результаты работы программы и их анализ для ООО "Кайрос".

    статья, добавлен 26.05.2017

  • Изучение функции "поиска подобных документов" как способа повышения качества информационного поиска в полнотекстовых базах. Алгоритм определения степени семантического сходства текста с эталоном. Схема оценки текстов на семантическое сходство с эталоном.

    статья, добавлен 25.08.2020

  • Общее описание разрабатываемого программного продукта. Определение функций приложения в виде списка требований. Диаграмма классов глобальной карты и архитектура программного приложения. Проектирование структур данных и алгоритмов, иерархия классов.

    дипломная работа, добавлен 14.12.2019

  • Программное обеспечение как совокупность всех программ, предназначенных для выполнения на компьютере. Приложения специального и общего назначения, процесс создания программ и разработка всех типов программного обеспечения. Решение вычислительных задач.

    презентация, добавлен 06.12.2016

  • Классификация текстовых документов в строительной отрасли. Изучение алгоритма построения классификационной модели методом Байеса с использованием языка программирования Python. Применение алгоритма в обработке проектной документации зданий и сооружений.

    статья, добавлен 21.02.2025

  • Задачи, которые решают нейронные сети. Кластеризация и визуализация данных. Прогнозирование временных рядов и оценивание рисков. Иллюстрации применения технологий информационного моделирования. Нейросетевые обучающиеся машины. Аппроксимация данных.

    лекция, добавлен 08.02.2013

  • Исследование технологии Near Field Communication, которая была анонсирована в 2004 году. Особенность программирования и считывания RFID-меток. Управление устройством с помощью NFC-меток. Характеристика использования приложений NFCTasks и NFCTools.

    реферат, добавлен 10.04.2023

  • Решение задач с использованием массивов: теоретическая часть и математическая формулировка задач. Многомерные массивы и инициализация элементов массива. Алгоритмы сортировки массивов и применение при решении задач. Код программы, обнуление матрицы.

    курсовая работа, добавлен 17.02.2011

  • Основные понятия порождающих грамматик и их алгоритмы. Методика решения задач. Представление грамматики в виде графа. Построение грамматики, аксиома которой зависит от всех нетерминалов. Удаление правил с терминальной правой частью. Описание процедур.

    курсовая работа, добавлен 03.01.2015

  • Анализ данных при помощи визуализаторов. Прогнозирование с помощью линейной регрессии. Кластеризация с помощью самоорганизующейся карты Кохонена. Описание демо-примера программы Deductor. Характеристика многомерного кросс-платформенного хранилища данных.

    лабораторная работа, добавлен 20.10.2012

  • Понятие о стохастическом программировании, удовлетворение ограничениям при каждой реализации случайного изменения параметра. Примеры задач стохастического программирования. Изучение одноэтапных стохастических задач с линейными решающими правилами.

    статья, добавлен 28.03.2020

  • Анализ методики выбора оптимального метода нормализации при построении кластерной структуры объектов. Высокая размерность признакового пространства. Анализ модели системы кластеризации с использованием алгоритма нечеткой кластеризации fuzzy C-means.

    статья, добавлен 01.03.2017

  • Функции конкурентного сходства (FRiS-функции) как инструмент для решения различных задач анализа данных. Применимость FRiS-функций при построении автоматической классификации множества объектов в условиях отсутствия априорной информации о числе классов.

    статья, добавлен 28.10.2018

  • Исследование иерархии классов и механизмов работы с наследованием. Анализ методов и полей классов для обработки данных при множественном наследовании. Создание тестируемых классов и реализация графического интерфейса на основе Simple DirectMedia Layer.

    курсовая работа, добавлен 20.05.2017

  • Анализ противоречий в нормативно-правовых документах, регламентирующих функционирование и взаимосвязь различных информационных систем. Отсутствие единой системы идентификации документов на основе номера уникальной адресации блоков текстов документов.

    статья, добавлен 24.05.2020

  • Определение списка как динамической структуры данных, каждый элемент которой связывается со следующим посредством указателя. Общедоступная, защищённая и обособленная части интерфейсного компонента класса. Реализация списка на C++ и листинг программы.

    реферат, добавлен 14.04.2011

  • Обзор методологии решения задач выполнимостей аппаратной реализации в системах автоматизированного проектирования и искусственного интеллекта. Построение алгоритма локального стохастического поиска. Разработка конфигурирования программного средства.

    статья, добавлен 02.09.2013

  • Цели объектно-ориентированного программирования, абстрактные классы и адреса базовых классов, множественное и виртуальное наследование. Инициализация элементов производного класса. Программный вызов конструкторов базового и производного классов.

    реферат, добавлен 30.10.2011

  • Построение стегоанализа текстовых данных, порожденных с использованием контекстно-свободных грамматик и с использованием метода замены синонимов. Стегоанализ исполняемых файлов и разработка схемы внедрения стеганографических меток в тексты программ.

    автореферат, добавлен 26.11.2013

  • Исследование алгоритмов автоматической сериализации и поиск возможных путей их оптимизации для выполнения специфических задач. Общая концепция процесса сериализации. формат объекта, сериализованного стандартными средствами. Этапы анализа для сжатия.

    статья, добавлен 30.04.2018

  • Типовые формы документов по технической эксплуатации и обслуживанию электрического и электромеханического оборудования. Технологии обработки табличной информации в среде табличного процессора Ms Excel. Освоение приемов автоматической нумерации абзацев.

    практическая работа, добавлен 03.12.2021

  • Теоретические основы задач ранжирования. Исследование основных подходов к реализации алгоритмов ранжирования. Выявление функции полезности. Наивный Байесовский классификатор. Описание алгоритма выявления предпочтений "при прочих равных" и его модификация.

    дипломная работа, добавлен 30.01.2016

  • Понятие и основные компоненты нейронных сетей, классификация образов. Обучение по алгоритму обратного распространения ошибок. Сети с радиальными базисными функциями. Кластеризация образов, самоорганизующаяся карта признаков. Дискретная сеть Хопфилда.

    книга, добавлен 18.01.2011

  • Экскурс в историю электронной криптографии. Ключевые принципы работы криптосистемы. Управление криптографическими ключами и алгоритмы шифрования. Электронные подписи и временные метки. Оценка стойкости шифра. Природа секретности квантового канала связи.

    курсовая работа, добавлен 12.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.