Сравнение подходов к кластеризации текстовой информации
Анализ различных методов кластеризации текстовых данных с акцентом на обработку научных статей. Освещение основных подходов, включая иерархическую кластеризацию информации, кластеризацию на основе разбиения, модельные и сетевые методы, их эффективность.
Подобные документы
Кодирование различных видов информации. Виды информации и способы представления ее в компьютере. Автоматизированная система управления технологическим процессом. Сетевые компоненты и пересылка данных, применяемые при обработке массивов информации.
реферат, добавлен 22.05.2014Исследование системы методов, подходов и идей обменом информации (данных), процессов ее восприятия, передачи, поиска, и отображения. Изучение природы и свойств информационных процессов - создание методов их обработки и организация хранения данных.
контрольная работа, добавлен 09.02.2009Показано, что анализ тональности текстовой информации входит в область задач компьютерной лингвистики и является подзадачей получения и обработки информации. Исследован процесс анализа тональности текста, реализуемого с помощью тонального словаря.
статья, добавлен 15.01.2019Понятие кластеризации и принципы работы ее алгоритмов. Этапы применения кластерного анализа для получения оптимального результата. Классификация алгоритмов кластеризации. Принцип работы алгоритма LargeItem. Понятие транзакций и проблема их кластеризации.
дипломная работа, добавлен 21.03.2016Изучение использования компьютеров в психодиагностическом процессе и создании "банка" информации на основе интеграции различных подходов. Анализ синтеза клинического и экспериментального методов в прикладной психологии на основе компьютерных технологий.
реферат, добавлен 23.11.2010Тестирование метрик оценки качества результатов кластеризации. Иерархические методы кластеризации. Метод выделения связных компонент. Индекс Калински-Харабаза, Болла-Холла. Дисперсия ближайшего соседа. Текст программы: спецификация, руководство оператора.
дипломная работа, добавлен 10.12.2019Виды социологической информации. Обработка социологических данных с применением компьютеров и специализированных пакетов программ. Примеры применения различных программ для обработки текстовых данных. Связи между понятиями в текстовых полях базы данных.
презентация, добавлен 09.10.2013Определение понятия и анализ структуры банка данных как организованной системы применения информации. Раскрытие сущности технологии обработки текстовых документов. Оценка назначения и изучение видов криптографических методов защиты. Деловая информация.
курсовая работа, добавлен 04.04.2012- 34. Применение алгоритмов кластеризации k-means и g-means в задачах распознавания воздушных объектов
Характеристика процесса распознавания воздушных объектов, который имеет ряд трудностей. Анализ использования кластеризации семействами алгоритмов k-means и g-means. Исследование работоспособности метода на примере информации о воздушных объектах.
статья, добавлен 30.04.2018 Рассмотрение общей схемы алгоритма кластеризации семантических дескрипторов, необходимого для анализа данных, представленных в виде текстов на естественном языке. Влияние различных параметров алгоритма на общую схему работ и перспективы развития подхода.
статья, добавлен 28.01.2020- 36. Проблемы автоматического восстановления текстовой информации, принятой с группированием искажений
Рассмотрение различных методов восстановления текстовой информации при возникновении искажений в процессе передачи ее по каналам связи низкого качества. Восстановление текста за счет смысловой избыточности как один из наиболее часто используемых методов.
статья, добавлен 10.03.2018 Характеристика классических методов кластеризации. Особенности самоорганизующихся карт Кохонена как одного из методов аппроксимации данных. Настройка веса на основе обучающего множества без учителя. Классический алгоритм "Победитель забирает все".
статья, добавлен 02.11.2018Разработка алгоритма расчета коэффициента кластеризации неполной сети и программы на основе полученного алгоритма. Использование параллельных вычислений для расчета коэффициента кластеризации. Принадлежность исследуемого узла к той или иной группе.
статья, добавлен 02.02.2019Существующие методы извлечения информации из текстовых данных. Способы извлечения сущностей и отношений. Описание методов автоматического построения онтологий по корпусу, а также способов их оценки. Идентификация фактов, локализованных во времени.
статья, добавлен 26.04.2019- 40. Нечеткая кластеризация потоков данных с помощью ЕМ-алгоритма на основе самообучения по Т. Кохонену
Описание мягкого вероятностного нечеткого алгоритма кластеризации многомерных данных, последовательно поступающих на обработку в режиме реального времени. Использование алгоритма для решения задач Dynamic Stream Mining в условиях перекрывающихся классов.
статья, добавлен 19.06.2018 Использование криптографических методов защиты информации. Хранение кодированных данных, программно-техническое разграничение доступа к ресурсам вычислительных систем. Проблема целостности информации, возникающей в процессе электронного документооборота.
статья, добавлен 03.12.2018Возможности программы, разработанной для проведения экспериментов, связанных с исследованием влияния энтропии текстовой информации на психоэмоциональное состояние человека. Обработка данных, представленных в виде смысловых текстовых конструкций.
статья, добавлен 29.04.2019Характеристика и особенности процесса построения нечеткого классификатора, специфика и применение метода субтрактивной кластеризации. Нечеткий классификатор на основе субтрактивной кластеризации. Сущность оптимизации структуры нечеткого классификатора.
статья, добавлен 17.01.2018Методы обнаружения ошибок. Автоматизация процесса исправления. Диалоговый и пакетный режимы. Сжатие словарей, структурированных данных, текстовой информации общего вида. Адаптивные и статистические алгоритмы. Кодирование фрагментов фиксированной длины.
курсовая работа, добавлен 31.01.2011Описание математических методов кодирования и сжатия звуковой информации. Характеристика различных форматов звуковых данных. Сравнительный анализ различных форматов звуковой информации. Характеристика преимуществ и недостатков формата MPEG Layer III.
дипломная работа, добавлен 26.05.2018Анализ и оценка одного из подходов к разработке информационной системы генерации формальных описаний научных статей. Исследование принципов функционирования такой системы, а также алгоритмов автоматического создания локальной базы данных цитирования.
доклад, добавлен 18.01.2018Алгоритм компрессии текстовых сообщений зонным методом. Программа на языке DELPHI5.0, позволяет осуществлять ввод текстовых данных пользователем, считывать их из специальных текстовых файлов, кодировать сообщение, вычисление коэффициента компрессии.
курсовая работа, добавлен 09.03.2009Рассмотрение проблемы надежного обеспечения сохранности информации и установления статуса ее использования. Особенности хранения разных типов информации. Выявление основных подходов к классификации и защите информации в современном российском обществе.
контрольная работа, добавлен 21.08.2017Проведен анализ данных о реализованных угрозах путем кластеризации разными методами с различным количеством кластеров, для выявления результатов разделения угроз наилучшим образом. Основные последствия реализации угроз информационной безопасности.
статья, добавлен 03.04.2018Необходимость классификации и кодирования экономической информации, их особенности и методы. Сущность понятий классификации и кластеризации. Свойства, требования и порядок построения иерархической и фасетной систем. Виды отношений между дескрипторами.
презентация, добавлен 07.09.2015