Подход к созданию комплекса инструментов автоматизированного анализа текстов на русском языке
Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
Подобные документы
- 1. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Этапы создания систем смыслового анализа текстов. "Retrans Vista" как система автоматизированного перевода текстов. Характеристика технологии обработки электронных фондов библиотек. Способы реализации автоматизированной системы анализа числовых данных.
автореферат, добавлен 10.12.2013 Особенности анализа структуры научных статей, анализ и описание информационного графа по матрице смежности. Характеристика графового метода определения структурированности текстов. Привлечение графовых моделей в системах автоматического анализа текстов.
статья, добавлен 14.11.2020Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
статья, добавлен 15.01.2019Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.
дипломная работа, добавлен 30.10.2017Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019История возникновения и развития компьютерной лингвистики. Инструменты анализа корпусов текстов. Системы и средства корпусного анализа. Факторный анализ соответствий корпуса противоправных текстов. Анализ специфичности корпуса противоправных текстов.
дипломная работа, добавлен 10.12.2019- 7. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Рассмотрение лексико-фразеологических и дискурсивных особенностей текстов научно-технического стиля, которые следует учитывать при разработке процедур автоматической обработки текстов. Описание элементов и языка записи шаблонов, методики их разработки.
реферат, добавлен 16.01.2018Принципы автоматизированного проектирования текстовой технической документации. Причины нарушения их информационной целостности, задачи и закономерности проведения контроля. Схема бортовых алгоритмов. Архитектура программного комплекса системы "ЛоТА".
статья, добавлен 17.01.2018Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.
статья, добавлен 04.05.2022Системный анализ лексики текстов и определение связи основных лексических конструкций с их значением. Формулирование на основе данного анализа правил сопоставления синтактико-грамматической и семантической моделей текста на естественном языке.
статья, добавлен 28.01.2020Рассмотрение основных способов смыслового анализа текстов. Особенности идентификации авторов и их публикаций из наукометрических баз данных на основе латентно-семантического анализа названий статей. Способ семантического анализа извлеченной информации.
статья, добавлен 25.02.2016Разработка математической модели обработки входящих потоков строк в алгоритм MgtyMf, позволяющий реализовывать поставленные цели. Проведение анализа текста и объективной оценки знания тестируемого. Изучение системы подключаемых программных модулей.
статья, добавлен 20.01.2022Характеристика контент-анализа в современной науке. Техника проведения контент-анализа, пример построения модели на его основе. Программные системы обработки информации. Информационно-аналитическая система обработки неформализованных естественных текстов.
презентация, добавлен 11.03.2015Применение корпусной лингвистики в области преподавания иностранного языка. Методология создания и разметки корпуса текстов. Проектирование упражнения для изучения политических терминов. Разработка программы для автоматизированного извлечения текстов.
дипломная работа, добавлен 07.10.2016Компьютерное моделирование человеческой способности к порождению высказываний как цель порождения текстов на естественном языке. Условия разнопланового развития и творческого потенциала в порождении текстов. Формализация представления грамматики языка.
статья, добавлен 22.01.2016Характеристика дерева синтаксического анализа: определение, представление в DCG и Prolog, применение для извлечения смысла. Особенности использования синтаксических и семантических конструкций в системе обозначений DCG. Преобразование интерпретатором.
презентация, добавлен 17.10.2013Численное исследование задач экономического анализа с помощью автоматизированной информационной системы. Основная характеристика изучения системы знаний, изучающей вопросы влияния налогообложения на условия устойчивого развития хозяйственных субъектов.
статья, добавлен 09.04.2019Бинарная классификация тональности русскоязычных текстов, основные подходы к ее анализу и извлечению синтаксических зависимостей в предложениях. Разработка Python-библиотека для бинарной классификации эмоциональной окраски русскоязычных текстов.
дипломная работа, добавлен 30.08.2016Современные технологии обработки естественного языка. Применение интернет ресурсов и искусственного интеллекта для обработки лингвистической информации. Преимущества эмбеддинговых моделей при классификации текстов. Методы распознавания и синтеза речи.
статья, добавлен 16.07.2021Иерархическая кластеризация информации в виде ключевых словосочетаний - традиционный подход к автоматическому построению таксономии. Характеристика основных подходов к решению задач, необходимых для проведения бикластерного анализа текстовых данных.
дипломная работа, добавлен 30.12.2015Компьютерная лингвистика как область знаний, связанная с решением задач автоматической обработки информации, представленной на естественном языке. Основные типы корпусов текстов. Анализ достоинств и недостатков автоматизированного машинного перевода.
реферат, добавлен 24.02.2014Экспериментальные результаты подхода, ориентированного в основном на фундаментальные аспекты проблемы обработки естественного языка. Автоматизация процесса формирования баз знаний путем сканирования соответствующих текстов на естественном языке.
статья, добавлен 18.01.2018Характеристика интеллектуальных измерительных систем. Описание сути и особенностей применения метода автоматизированного системно-когнитивного анализа. Решение задач многопараметрической типизации и системной идентификации состояний сложных объектов.
статья, добавлен 22.05.2017Система, разработанная для автоматического поиска и выделения в тексте на русском языке конструкций по их описанию в виде лексико-синтаксических шаблонов языка LSPL. Применение системы для решения различных прикладных задач, требующих анализа ЕЯ-текстов.
статья, добавлен 19.01.2018