Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний
Разработка математических моделей текстов на естественном языке предназначенных для поиска, классификации и кластеризации данных. Таксономическое представление текстовых документов в виде решетки замкнутых структурных синтактико-семантических описаний.
Подобные документы
Рассмотрение общей схемы алгоритма кластеризации семантических дескрипторов, необходимого для анализа данных, представленных в виде текстов на естественном языке. Влияние различных параметров алгоритма на общую схему работ и перспективы развития подхода.
статья, добавлен 28.01.2020Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019Ускорение процесса принятия решений в динамических организационных системах, особенно при необходимости обработки большого количества значимых слабоструктурированных текстовых данных. Обработка слабоструктурированных текстовых данных на русском языке.
статья, добавлен 03.04.2023Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.
дипломная работа, добавлен 30.06.2017- 5. Система комплексного анализа русскоязычных текстовых сообщений на платформе IBM InfoSphere Streams
Анализ методов предварительной обработки текстовых сообщений, способов классификации и кластеризации. Программы определения тональности текста. Представление текста в виде дерева синтаксического разбора. Разработка системы анализа текстовой информации.
магистерская работа, добавлен 09.07.2016 Исследование графена и задачи теории перколяции. Анализ методов нахождения замкнутых контуров на графе. Алгоритмы нахождения замкнутых контуров на графе. Реализация метода для определения замкнутых областей на поверхности четырех и шестиугольной решеток.
курсовая работа, добавлен 10.01.2016Основные подходы к сбору и обработке текстовых данных. Подходы к очистке табличных текстовых данных. Скрапинг веб-сайтов и работа с API. Реализация алгоритмов обработки данных ветеринарных сайтов. Сбор источников данных по рынку ветеринарных услуг Москвы.
дипломная работа, добавлен 07.12.2019Системный анализ лексики текстов и определение связи основных лексических конструкций с их значением. Формулирование на основе данного анализа правил сопоставления синтактико-грамматической и семантической моделей текста на естественном языке.
статья, добавлен 28.01.2020Виды социологической информации. Обработка социологических данных с применением компьютеров и специализированных пакетов программ. Примеры применения различных программ для обработки текстовых данных. Связи между понятиями в текстовых полях базы данных.
презентация, добавлен 09.10.2013Системы исчисления и двоичное представление информации в памяти компьютера. Процесс кодирования текстовых данных. Нахождение информационного объема сообщения. Представление целых чисел в вычислительной машине. Арифметические операции над величинами.
контрольная работа, добавлен 31.01.2014Особенности создания модели базы данных на естественном языке. Анализ запроса пользователя для общения конечного пользователя с информационной системой на естественном языке. Проведение поиска информации, ожидание выдачи ответа на естественном языке.
статья, добавлен 24.03.2016Программные системы, которые идентифицируются своим Web-адресом со стандартизированными интерфейсами. Использование SOA для построения информационных систем. Хранение в репозиториях семантических описаний Web-служб и использование их в процессе поиска.
реферат, добавлен 22.01.2017Обоснование разработанного метода, позволяющего отнести тот или иной обособленный текстовый фрагмент слабоструктурированного текстового документа к атрибуту данных или к значению атрибута данных. Абсолютная встречаемость атомарных объектов в документах.
статья, добавлен 19.06.2018Классификация структур данных. Алгоритмы поиска и сортировки массивов и файлов. Работа с последовательностями. Динамические структуры данных – виды списков и деревья поиска. Методы машинного представления графов, алгоритмы обхода, поиска кратчайших путей.
учебное пособие, добавлен 02.04.2012Применение процедур локальной аппроксимации для решения задачи классификации траекторий на основе критериев точечного сходства. Представление рядов в виде матричных наборов данных и применение алгоритма нечетких средних для их дальнейшей кластеризации.
статья, добавлен 27.02.2019Использование CASE-средств при создании информационно-логической модели для документирования и проектирования баз данных. Анализ предметной области и изучение нормативных документов. Создание реляционной базы данных. Осуществление ввода текстовых данных.
курсовая работа, добавлен 27.02.2020Рассмотрение задачи аспектного анализа тональности текстовых сообщений на естественном языке. Исследование четырех нейросетевых моделей, относящихся к разделу глубокого обучения, результаты проверки моделей на корпусе текстовых отзывов SentiRuEval-2015.
статья, добавлен 27.05.2018Разработка системы автоматизированной обработки больших объемов динамической текстовой информации. Схемы кластеризации документов по морскому и речному делу. Предварительная обработка электронных текстов. Корректировка обучающего массива и индексирование.
статья, добавлен 25.12.2016Основные понятия и определения криптографии и шифрования информации. Криптографические примитивы и программные шифраторы. Шифрование и дешифрование в Net Framework. Алгоритмическая блок-схема процесса криптографии текстовых данных в программной среде.
курсовая работа, добавлен 07.01.2014Представление произвольных графовых моделей данных в виде n-арных деревьев во внешней памяти, обеспечивающий выполнение операций помещения, извлечения и поиска элементов данных за логарифмическое время. Поиск свойств и связей, принадлежащих объектам.
статья, добавлен 30.07.2017Поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, как с коллекциями текстовых документов в научной области. Понятие онтологии, соотношение смыслов поиска и языковых слов, используемых в запросе.
статья, добавлен 10.05.2022Разработка алгоритма формирования информационных образов электронных текстовых документов, включающий механизм сокращения признаков, основанный на подходе к оценке тематической значимости признаков документов. Нейросетевой анализ коллекции документов.
автореферат, добавлен 31.07.2018Классификация систем подготовки текстовых документов. Описание возможностей различных текстовых редакторов и процессоров. Изучение особенностей процессов подготовки текстовых документов на примере Microsoft Word. Редактирование и форматирование текста.
реферат, добавлен 07.04.2014Анализ существующих систем хранения и обработки информации. Разработка новых аналитических моделей и алгоритмов интеллектуального анализа данных и программного комплекса системы поддержки принятия решений на основе многомерных моделей хранилищ данных.
автореферат, добавлен 28.03.2018Подходы, методика и алгоритмы лингвосемантического анализа и формализации информации для ситуационных центров государственной власти, представленной на естественном языке. Разработка алгоритмов формирования тезаурусных описаний экспертной информации.
автореферат, добавлен 02.05.2018