Метод компаративного анализа группы текстов (на материале немецкоязычных научных статей)

Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.

Подобные документы

  • Формат файла JPEG как эффективный метод хранения изображений с большой глубиной цвета. Особенности алгоритма сжатия с потерями информации. Формирование изображения JPEG для пользователь и оптимальные показатели качества. Применение вторичного сжатия.

    реферат, добавлен 12.06.2010

  • Исследование применения статистической оценки энтропии Тсаллиса в качестве тестовой статистики для анализа близости выходных последовательностей криптографических генераторов псевдослучайных последовательностей. Метод статистического тестирования.

    доклад, добавлен 03.05.2019

  • Преимущества акустико-эмиссионного метода неразрушающего контроля. Разработка обобщенной схемы работы алгоритма, реализация программной части в среде LabView. Основные операции потока обработки данных, выполняемые действия, проверка работоспособности.

    курсовая работа, добавлен 24.12.2013

  • Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.

    дипломная работа, добавлен 30.10.2017

  • Кодирование методом Хаффмана, перевод кодового числа в двоичный формат. Кодирование и раскодирование данных с помощью алгоритма LZ77 и LZSS. Поиск различий между словарными алгоритмами путем сравнительного анализа закодированных последовательностей.

    лабораторная работа, добавлен 29.07.2017

  • Автоматизация учета и анализа товарооборота на предприятии. Разработка архитектуры программной системы. Рассмотрение физической модели базы данных, алгоритма программы. Прогнозирование уровня продажи товаров в программном средстве Borland C++ 6.0.

    дипломная работа, добавлен 01.05.2015

  • Результаты реализации модуля программной системы для проведения лингвистических исследований. Хранение и получение текстов из корпусов с использованием индексации на основе естественно-языковой адресации в виде wcf-сервиса. Подход к хранению корпусов.

    дипломная работа, добавлен 23.09.2018

  • Метод построения систем смыслопорождения на основе парадигмы предельных обобщений. Создание банка конфигураторов текстов и прецедентов. Разработка иерархии конфигураторов текстов для задач мониторинга. Мониторинг состояния сложных систем и процессов.

    статья, добавлен 30.08.2016

  • Рассмотрение общей схемы алгоритма кластеризации семантических дескрипторов, необходимого для анализа данных, представленных в виде текстов на естественном языке. Влияние различных параметров алгоритма на общую схему работ и перспективы развития подхода.

    статья, добавлен 28.01.2020

  • Разработка математической модели обработки входящих потоков строк в алгоритм MgtyMf, позволяющий реализовывать поставленные цели. Проведение анализа текста и объективной оценки знания тестируемого. Изучение системы подключаемых программных модулей.

    статья, добавлен 20.01.2022

  • Разработка и обоснование общей структуры базы знаний для представления семантики ценностно-ориентированных текстов. Формулировка правил построения формального описания по тексту на естественном языке. Описание алгоритмов поиска по ключевым словам.

    автореферат, добавлен 27.09.2018

  • Разработка проекта и реализация программного средства для обработки цифровых сигналов. Принципы работы с файловой системой для выбора группы файлов или файла для обработки. Отображение графиков временных реализаций, варианты реализации данных процедур.

    лабораторная работа, добавлен 30.11.2016

  • Исследование способов автоматического распознавания дефектов на изображениях и цифрового восстановления поврежденных фотографий, определение их достоинств и недостатков. Разработка алгоритма обнаружения царапин на изображении в автоматическом режиме.

    статья, добавлен 30.05.2017

  • Изучение специфики использования сетевого анализа в исторических исследованиях, которая выражается в постановке задач, структуре источников и методов их анализа. Выявление сетей индивидуумов на основе корпуса исторических текстов (типа эго-документов).

    статья, добавлен 08.04.2019

  • Поиск эффективного метода для удаления нецензурных слов или выражений из текстов, статей и некоторых интернет-страниц. Формальная постановка задачи. Описание данных и используемых мер близости. Составление коллекции и разметка, программная реализация.

    курсовая работа, добавлен 30.08.2016

  • Формирование последовательностей и разработка алгоритма в соответствии с принципом процедурной абстракции. Выбор основных функций программы. Описание функции malloc. Анализ алгоритма создания последовательностей. Составление программы на языке Си.

    лабораторная работа, добавлен 12.05.2015

  • Понятие рекурсии и её виды. Общие принципы ее программной реализации. Выбор языка программирования для реализации алгоритма. Схема механизма вызова функции в аппаратном стеке. Блок-схема нахождения факториала числа. Метод Фибоначчи JAVA и его отладка.

    курсовая работа, добавлен 19.01.2019

  • Иерархическая кластеризация информации в виде ключевых словосочетаний - традиционный подход к автоматическому построению таксономии. Характеристика основных подходов к решению задач, необходимых для проведения бикластерного анализа текстовых данных.

    дипломная работа, добавлен 30.12.2015

  • Разработка и анализ работы алгоритмов для анализа тональности агрессивных комментариев, автоматического определения их эмоционального окраса. Реализация классифицирующих моделей машинного обучения, оценка их качества и сравнение их эффективности.

    дипломная работа, добавлен 10.12.2019

  • Исследование основных возможностей программы PowerPoint. Анализ случаев, когда нужно поменять формат файла. Характеристика программ для конвертации файлов презентации. Изучение некоторых форматов файлов, используемых в презентациях и их конвертировании.

    методичка, добавлен 21.01.2015

  • Особенности научных статей, представленных в формате PDF. Разработка классов для системы автоматической разметки. Выбор программного обеспечения для реализации и обучения нейронной сети. Алгоритмы сортировки блоков в соответствии с иерархией документа.

    дипломная работа, добавлен 13.07.2020

  • Современные технологии обработки естественного языка. Применение интернет ресурсов и искусственного интеллекта для обработки лингвистической информации. Преимущества эмбеддинговых моделей при классификации текстов. Методы распознавания и синтеза речи.

    статья, добавлен 16.07.2021

  • Характеристика предпроектной ситуации. Описание проектирования структуры с учётом исходных данных. Выбор количества каналов и фильтра. Расчёт резисторов для усилителей. Структурная схема и алгоритм работы МПУ сбора и первичной обработки информации.

    курсовая работа, добавлен 05.01.2018

  • Принципы формирования растрового и векторного изображения. Способность растровых форматов нести дополнительную информацию. Проблема сохранения изображений для последующей их обработки. Наиболее распространенные алгоритмы сжатия. Преобразование файлов.

    курсовая работа, добавлен 19.04.2011

  • Определение особенностей разработки модели функционирования системы: диаграммы прецедентов, классов, последовательностей и состояний. Выбор средств программной реализации. Разработка пользовательского интерфейса. Описание диалога с пользователем.

    курсовая работа, добавлен 08.05.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.