Создание и анализ специальных корпусов текстов на основе расширенной платформы TXM
История возникновения и развития компьютерной лингвистики. Инструменты анализа корпусов текстов. Системы и средства корпусного анализа. Факторный анализ соответствий корпуса противоправных текстов. Анализ специфичности корпуса противоправных текстов.
Подобные документы
Особенности анализа структуры научных статей, анализ и описание информационного графа по матрице смежности. Характеристика графового метода определения структурированности текстов. Привлечение графовых моделей в системах автоматического анализа текстов.
статья, добавлен 14.11.2020Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
статья, добавлен 15.01.2019Обучение морфологического анализатора на основе искусственных нейронных сетей для разметки Санкт-Петербургского корпуса агиографических текстов. Опыт использования нейросетевой модели с языковым переносом для частеречной разметки древнерусских текстов.
статья, добавлен 03.03.2024- 4. Разработка системы анализа стилистики синтаксических конструкций научных текстов на английском языке
Задача автоматизированного анализа стиля англоязычных текстов. Описание алгоритмов и библиотек для автоматизированного анализа текстов на английском языке. Реализация системы для анализа синтаксического стиля научных текстов на английском языке.
дипломная работа, добавлен 27.08.2018 Применение корпусной лингвистики в области преподавания иностранного языка. Методология создания и разметки корпуса текстов. Проектирование упражнения для изучения политических терминов. Разработка программы для автоматизированного извлечения текстов.
дипломная работа, добавлен 07.10.2016Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016Компьютерная лингвистика как область знаний, связанная с решением задач автоматической обработки информации, представленной на естественном языке. Основные типы корпусов текстов. Анализ достоинств и недостатков автоматизированного машинного перевода.
реферат, добавлен 24.02.2014Сущность и предмет исследования, а также история развития компьютерной лингвистики. Особенности применения статистических методов в языкознании. Математический аппарат для исследования текстов на естественном языке, используемое программное обеспечение.
курсовая работа, добавлен 12.06.2016- 9. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Этапы создания систем смыслового анализа текстов. "Retrans Vista" как система автоматизированного перевода текстов. Характеристика технологии обработки электронных фондов библиотек. Способы реализации автоматизированной системы анализа числовых данных.
автореферат, добавлен 10.12.2013 Изучение специфики использования сетевого анализа в исторических исследованиях, которая выражается в постановке задач, структуре источников и методов их анализа. Выявление сетей индивидуумов на основе корпуса исторических текстов (типа эго-документов).
статья, добавлен 08.04.2019- 11. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Рассмотрение лексико-фразеологических и дискурсивных особенностей текстов научно-технического стиля, которые следует учитывать при разработке процедур автоматической обработки текстов. Описание элементов и языка записи шаблонов, методики их разработки.
реферат, добавлен 16.01.2018Бинарная классификация тональности русскоязычных текстов, основные подходы к ее анализу и извлечению синтаксических зависимостей в предложениях. Разработка Python-библиотека для бинарной классификации эмоциональной окраски русскоязычных текстов.
дипломная работа, добавлен 30.08.2016Проект системы поддержки принятия решений для рубрикации научных текстов с учетом их особенностей. Исследование искусственных нейронных сетей, логистической регрессии. Анализ данных, извлечение признаков из текстов, разработка настольного приложения.
дипломная работа, добавлен 02.09.2018Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.
статья, добавлен 04.05.2022Перспективы нового программного приложения для редактирования текстов, имеющих общее происхождение. Адаптация аппарата теории нечетких множеств. Массовое сопоставление и анализ средневековых текстов с помощью алгоритмизированных математических методов.
статья, добавлен 08.04.2019Преобразование алгоритмов, основанных на использовании суффиксных деревьев. Построение графов связей между ключевыми словосочетаниями согласно анализируемому корпусу текстов. Разработка модифицированного программного продукта, реализующего алгоритмы.
дипломная работа, добавлен 07.07.2016Компьютерное моделирование человеческой способности к порождению высказываний как цель порождения текстов на естественном языке. Условия разнопланового развития и творческого потенциала в порождении текстов. Формализация представления грамматики языка.
статья, добавлен 22.01.2016Характеристика контент-анализа в современной науке. Техника проведения контент-анализа, пример построения модели на его основе. Программные системы обработки информации. Информационно-аналитическая система обработки неформализованных естественных текстов.
презентация, добавлен 11.03.2015Изучение методов работы и взаимодействия с базами данных. Рассмотрение алгоритма Рабина–Карпа для определения плагиата. Разработка программы для оценки схожести текстов, методика ее использования. Тестирование программы с помощью набора тест-кейсов.
курсовая работа, добавлен 10.12.2016Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.
дипломная работа, добавлен 30.10.2017- 22. Организация работы торгового предприятия, реализующего программное обеспечение для перевода текстов
Проблема автоматического перевода текстов, особенности программного обеспечения этого процесса. Программы для орфографической проверки текста. Программные продукты в области лингвистики, семантики, электронной лексикографии и специфика их использования.
контрольная работа, добавлен 26.04.2013 Изучение функции "поиска подобных документов" как способа повышения качества информационного поиска в полнотекстовых базах. Алгоритм определения степени семантического сходства текста с эталоном. Схема оценки текстов на семантическое сходство с эталоном.
статья, добавлен 25.08.2020Метод построения систем смыслопорождения на основе парадигмы предельных обобщений. Создание банка конфигураторов текстов и прецедентов. Разработка иерархии конфигураторов текстов для задач мониторинга. Мониторинг состояния сложных систем и процессов.
статья, добавлен 30.08.2016Удобство и эффективность применения компьютеров для подготовки текстов. Создание текстовых файлов, редактирование текстов, просмотр их на экране, изменение формата текстового документа при помощи программ. Специальные возможности Microsoft Word.
реферат, добавлен 27.03.2014