Метод компаративного анализа группы текстов (на материале немецкоязычных научных статей)
Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.
Подобные документы
- 1. Разработка системы анализа стилистики синтаксических конструкций научных текстов на английском языке
Задача автоматизированного анализа стиля англоязычных текстов. Описание алгоритмов и библиотек для автоматизированного анализа текстов на английском языке. Реализация системы для анализа синтаксического стиля научных текстов на английском языке.
дипломная работа, добавлен 27.08.2018 - 2. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Этапы создания систем смыслового анализа текстов. "Retrans Vista" как система автоматизированного перевода текстов. Характеристика технологии обработки электронных фондов библиотек. Способы реализации автоматизированной системы анализа числовых данных.
автореферат, добавлен 10.12.2013 Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016- 4. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Характеристика контент-анализа в современной науке. Техника проведения контент-анализа, пример построения модели на его основе. Программные системы обработки информации. Информационно-аналитическая система обработки неформализованных естественных текстов.
презентация, добавлен 11.03.2015Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
статья, добавлен 15.01.2019Изучение методов работы и взаимодействия с базами данных. Рассмотрение алгоритма Рабина–Карпа для определения плагиата. Разработка программы для оценки схожести текстов, методика ее использования. Тестирование программы с помощью набора тест-кейсов.
курсовая работа, добавлен 10.12.2016История возникновения и развития компьютерной лингвистики. Инструменты анализа корпусов текстов. Системы и средства корпусного анализа. Факторный анализ соответствий корпуса противоправных текстов. Анализ специфичности корпуса противоправных текстов.
дипломная работа, добавлен 10.12.2019Системно-когнитивный анализ паспортов научных специальностей ВАК РФ. Разработка автоматизированной технологии формирования семантических ядер предметной области. Применение интеллектуальной системы "Эйдос" для классификации текстов статей по ветеринарии.
статья, добавлен 08.02.2019Рассмотрение лексико-фразеологических и дискурсивных особенностей текстов научно-технического стиля, которые следует учитывать при разработке процедур автоматической обработки текстов. Описание элементов и языка записи шаблонов, методики их разработки.
реферат, добавлен 16.01.2018Удобство и эффективность применения компьютеров для подготовки текстов. Создание текстовых файлов, редактирование текстов, просмотр их на экране, изменение формата текстового документа при помощи программ. Специальные возможности Microsoft Word.
реферат, добавлен 27.03.2014Проект системы поддержки принятия решений для рубрикации научных текстов с учетом их особенностей. Исследование искусственных нейронных сетей, логистической регрессии. Анализ данных, извлечение признаков из текстов, разработка настольного приложения.
дипломная работа, добавлен 02.09.2018Требования к функционалу программной реализации, предварительная обработка текстовых данных. Программная реализация, описание логической структуры. Зависимость качества от числа авторов и от объёма текстов. Особенности и значение индексации документов.
курсовая работа, добавлен 05.08.2018Изучение методов получения и обработки статей из электронных научных журналов. Скачивание и обработка библиографических статей. Этапы обработки и анализа текстовых документов. Выбор средств разработки программного комплекса. Парсинг электронных журналов.
курсовая работа, добавлен 18.12.2016Осуществление постановки и выбор алгоритмов решения задач обработки экономической информации. Разработка и программная реализация для их решения. Метод проектирования алгоритма. Разработка блок-схемы алгоритма. Метод тестирования. Инструкция пользователя.
курсовая работа, добавлен 19.12.2017Анализ инструментов сбора, обработки и анализа информации, необходимых для подготовки исследовательских работ и научных статей. Классификация баз хранения первичной и вторичной научной информации, способы доступа к международным информационным системам.
статья, добавлен 27.05.2018Рассмотрение основных способов смыслового анализа текстов. Особенности идентификации авторов и их публикаций из наукометрических баз данных на основе латентно-семантического анализа названий статей. Способ семантического анализа извлеченной информации.
статья, добавлен 25.02.2016Кластеризация как процесс разделения исследуемого множества объектов на группы "похожих" объектов, называемых кластерами. Методы кластерного анализа и их общая характеристика: метод k-средних, метод ISODATA, агломеративный метод, дивизимный метод.
презентация, добавлен 23.09.2017Двоично-десятичное кодирование. Стандарты кодирования текстов. Разработка алгоритма преобразования форматов двоичных данных, его программной реализации. Распределение памяти и листинг программы. Описание использованных средств вычислительной техники.
контрольная работа, добавлен 16.10.2017Бинарная классификация тональности русскоязычных текстов, основные подходы к ее анализу и извлечению синтаксических зависимостей в предложениях. Разработка Python-библиотека для бинарной классификации эмоциональной окраски русскоязычных текстов.
дипломная работа, добавлен 30.08.2016Изучение результатов анализа актуальности существующих работ по изучению нейросетевых алгоритмов обнаружения вредоносного программного обеспечения. Ознакомление с набором данных, содержащим последовательности системных запросов для исполняемых файлов.
статья, добавлен 09.05.2022Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019Метод распознавания образов на изображении, основанный на определении центра масс исходного образа в совокупности с анализом отдельных признаков, свойственных геометрическим фигурам. Способ анализа для распознания фигур, имеющих несколько осей симметрии.
статья, добавлен 31.07.2018Обработка изображения с применением фильтра Габора. Алгоритмы обработки образов, основанные на сглаживающих или медианных фильтрах. Метод пространственной фильтрации образа, заключающейся в реализации физического процесса поглощения и отражения света.
дипломная работа, добавлен 01.10.2017Преобразование алгоритмов, основанных на использовании суффиксных деревьев. Построение графов связей между ключевыми словосочетаниями согласно анализируемому корпусу текстов. Разработка модифицированного программного продукта, реализующего алгоритмы.
дипломная работа, добавлен 07.07.2016