Классификация древнетибетских текстов с помощью методов спектрального анализа
Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
Подобные документы
Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016Особенности анализа структуры научных статей, анализ и описание информационного графа по матрице смежности. Характеристика графового метода определения структурированности текстов. Привлечение графовых моделей в системах автоматического анализа текстов.
статья, добавлен 14.11.2020Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.
дипломная работа, добавлен 30.10.2017История возникновения и развития компьютерной лингвистики. Инструменты анализа корпусов текстов. Системы и средства корпусного анализа. Факторный анализ соответствий корпуса противоправных текстов. Анализ специфичности корпуса противоправных текстов.
дипломная работа, добавлен 10.12.2019- 5. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Этапы создания систем смыслового анализа текстов. "Retrans Vista" как система автоматизированного перевода текстов. Характеристика технологии обработки электронных фондов библиотек. Способы реализации автоматизированной системы анализа числовых данных.
автореферат, добавлен 10.12.2013 Особенности функционирования систем извлечения информации из текстов на естественном языке. Метрики проекта TIPSTER и программы TIDES, их достоинства и недостатки. Использование метрик для оценки качества функционирования систем семейства OntosMiner.
статья, добавлен 17.01.2018Изучение методов работы и взаимодействия с базами данных. Рассмотрение алгоритма Рабина–Карпа для определения плагиата. Разработка программы для оценки схожести текстов, методика ее использования. Тестирование программы с помощью набора тест-кейсов.
курсовая работа, добавлен 10.12.2016Бинарная классификация тональности русскоязычных текстов, основные подходы к ее анализу и извлечению синтаксических зависимостей в предложениях. Разработка Python-библиотека для бинарной классификации эмоциональной окраски русскоязычных текстов.
дипломная работа, добавлен 30.08.2016Особенности технологий аналитической обработки данных, а именно OLAP и ИАД (интеллектуального анализа данных), а также их интеграция. Применение данных методов работы с разнородной информацией больших объемов, методы хранения и работы с большими данными.
статья, добавлен 27.02.2019Перспективы нового программного приложения для редактирования текстов, имеющих общее происхождение. Адаптация аппарата теории нечетких множеств. Массовое сопоставление и анализ средневековых текстов с помощью алгоритмизированных математических методов.
статья, добавлен 08.04.2019Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.
статья, добавлен 04.05.2022Описание системы анализа данных расчетного комплекса "РЕАКТОР", предназначенной для эффективной поддержки решения задач анализа и представления больших объемов данных, обеспечения пользователя удобными и мощными средствами анализа результатов счета.
научная работа, добавлен 28.10.2018Рассмотрение основных способов смыслового анализа текстов. Особенности идентификации авторов и их публикаций из наукометрических баз данных на основе латентно-семантического анализа названий статей. Способ семантического анализа извлеченной информации.
статья, добавлен 25.02.2016- 14. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Характеристики компьютерных программ для проведения статистического анализа данных, выявления связей, построения прогнозов. Программные пакеты, реализующие функции анализа, управления, добычи, визуализации данных с привлечением статистических методов.
статья, добавлен 20.02.2019Рассмотрение лексико-фразеологических и дискурсивных особенностей текстов научно-технического стиля, которые следует учитывать при разработке процедур автоматической обработки текстов. Описание элементов и языка записи шаблонов, методики их разработки.
реферат, добавлен 16.01.2018Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019- 18. Система извлечения и анализа текстовых данных из социальных сетей для образовательного учреждения
Употребление инструментов, предоставляемых социальными сетями и мессенджерами, для построения системы анализа больших данных для поддержки работы образовательной организации. Применение методов обработки естественного языка (natural language processing).
статья, добавлен 14.02.2022 Компьютерное моделирование человеческой способности к порождению высказываний как цель порождения текстов на естественном языке. Условия разнопланового развития и творческого потенциала в порождении текстов. Формализация представления грамматики языка.
статья, добавлен 22.01.2016- 20. Использование библиотеки классов пакета "Sage" для анализа программ, написанных на языке Фортран
Использование библиотеки классов Си++ пакета SAGE для анализа больших последовательных программ, написанных на языке ФОРТРАН 77, для превращения их в параллельные программы. Структура данных, используемых пакетом для внутреннего представления программы.
статья, добавлен 28.10.2018 Технологии и методы интеллектуального анализа данных. Этапы процесса интеллектуального анализа. Задачи, которые решает Data mining. Концепция методов кластерного анализа. Вещественно-значные, бинарные, номинальные, порядковые переменные и их значимость.
статья, добавлен 28.01.2019Определение и приемы анализа текстов с целью нахождения и извлечения мнений и отношений автора к процессу, событию или объекту из текста в естественном языке. Исследование тональности и выделение маркеров отношения в текстах, посвященных сети Интернет.
реферат, добавлен 30.06.2017Работа с информацией огромного объема. Тенденции развития информационных систем в соответствии с технологиями обработки больших данных. Обработка больших данных, ее связь с технологиями бизнес-анализа и развитием на их основе подходов к интеграции данных.
статья, добавлен 18.07.2018Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Системный анализ лексики текстов и определение связи основных лексических конструкций с их значением. Формулирование на основе данного анализа правил сопоставления синтактико-грамматической и семантической моделей текста на естественном языке.
статья, добавлен 28.01.2020