Метод компаративного анализа группы текстов (на материале немецкоязычных научных статей)
Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.
Подобные документы
- 26. Формат JPEG
Формат файла JPEG как эффективный метод хранения изображений с большой глубиной цвета. Особенности алгоритма сжатия с потерями информации. Формирование изображения JPEG для пользователь и оптимальные показатели качества. Применение вторичного сжатия.
реферат, добавлен 12.06.2010 - 27. Тестирование псевдослучайных криптографических генераторов на основе энтропийных статистик Тсаллиса
Исследование применения статистической оценки энтропии Тсаллиса в качестве тестовой статистики для анализа близости выходных последовательностей криптографических генераторов псевдослучайных последовательностей. Метод статистического тестирования.
доклад, добавлен 03.05.2019 Преимущества акустико-эмиссионного метода неразрушающего контроля. Разработка обобщенной схемы работы алгоритма, реализация программной части в среде LabView. Основные операции потока обработки данных, выполняемые действия, проверка работоспособности.
курсовая работа, добавлен 24.12.2013Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.
дипломная работа, добавлен 30.10.2017Кодирование методом Хаффмана, перевод кодового числа в двоичный формат. Кодирование и раскодирование данных с помощью алгоритма LZ77 и LZSS. Поиск различий между словарными алгоритмами путем сравнительного анализа закодированных последовательностей.
лабораторная работа, добавлен 29.07.2017Автоматизация учета и анализа товарооборота на предприятии. Разработка архитектуры программной системы. Рассмотрение физической модели базы данных, алгоритма программы. Прогнозирование уровня продажи товаров в программном средстве Borland C++ 6.0.
дипломная работа, добавлен 01.05.2015Результаты реализации модуля программной системы для проведения лингвистических исследований. Хранение и получение текстов из корпусов с использованием индексации на основе естественно-языковой адресации в виде wcf-сервиса. Подход к хранению корпусов.
дипломная работа, добавлен 23.09.2018Метод построения систем смыслопорождения на основе парадигмы предельных обобщений. Создание банка конфигураторов текстов и прецедентов. Разработка иерархии конфигураторов текстов для задач мониторинга. Мониторинг состояния сложных систем и процессов.
статья, добавлен 30.08.2016Рассмотрение общей схемы алгоритма кластеризации семантических дескрипторов, необходимого для анализа данных, представленных в виде текстов на естественном языке. Влияние различных параметров алгоритма на общую схему работ и перспективы развития подхода.
статья, добавлен 28.01.2020Разработка математической модели обработки входящих потоков строк в алгоритм MgtyMf, позволяющий реализовывать поставленные цели. Проведение анализа текста и объективной оценки знания тестируемого. Изучение системы подключаемых программных модулей.
статья, добавлен 20.01.2022Разработка и обоснование общей структуры базы знаний для представления семантики ценностно-ориентированных текстов. Формулировка правил построения формального описания по тексту на естественном языке. Описание алгоритмов поиска по ключевым словам.
автореферат, добавлен 27.09.2018Разработка проекта и реализация программного средства для обработки цифровых сигналов. Принципы работы с файловой системой для выбора группы файлов или файла для обработки. Отображение графиков временных реализаций, варианты реализации данных процедур.
лабораторная работа, добавлен 30.11.2016Исследование способов автоматического распознавания дефектов на изображениях и цифрового восстановления поврежденных фотографий, определение их достоинств и недостатков. Разработка алгоритма обнаружения царапин на изображении в автоматическом режиме.
статья, добавлен 30.05.2017Изучение специфики использования сетевого анализа в исторических исследованиях, которая выражается в постановке задач, структуре источников и методов их анализа. Выявление сетей индивидуумов на основе корпуса исторических текстов (типа эго-документов).
статья, добавлен 08.04.2019Поиск эффективного метода для удаления нецензурных слов или выражений из текстов, статей и некоторых интернет-страниц. Формальная постановка задачи. Описание данных и используемых мер близости. Составление коллекции и разметка, программная реализация.
курсовая работа, добавлен 30.08.2016Формирование последовательностей и разработка алгоритма в соответствии с принципом процедурной абстракции. Выбор основных функций программы. Описание функции malloc. Анализ алгоритма создания последовательностей. Составление программы на языке Си.
лабораторная работа, добавлен 12.05.2015Понятие рекурсии и её виды. Общие принципы ее программной реализации. Выбор языка программирования для реализации алгоритма. Схема механизма вызова функции в аппаратном стеке. Блок-схема нахождения факториала числа. Метод Фибоначчи JAVA и его отладка.
курсовая работа, добавлен 19.01.2019Иерархическая кластеризация информации в виде ключевых словосочетаний - традиционный подход к автоматическому построению таксономии. Характеристика основных подходов к решению задач, необходимых для проведения бикластерного анализа текстовых данных.
дипломная работа, добавлен 30.12.2015Разработка и анализ работы алгоритмов для анализа тональности агрессивных комментариев, автоматического определения их эмоционального окраса. Реализация классифицирующих моделей машинного обучения, оценка их качества и сравнение их эффективности.
дипломная работа, добавлен 10.12.2019- 45. Конвертирование файлов презентации в различные форматы (Применительно к MS PowerPoint 2010, 2013)
Исследование основных возможностей программы PowerPoint. Анализ случаев, когда нужно поменять формат файла. Характеристика программ для конвертации файлов презентации. Изучение некоторых форматов файлов, используемых в презентациях и их конвертировании.
методичка, добавлен 21.01.2015 Особенности научных статей, представленных в формате PDF. Разработка классов для системы автоматической разметки. Выбор программного обеспечения для реализации и обучения нейронной сети. Алгоритмы сортировки блоков в соответствии с иерархией документа.
дипломная работа, добавлен 13.07.2020Современные технологии обработки естественного языка. Применение интернет ресурсов и искусственного интеллекта для обработки лингвистической информации. Преимущества эмбеддинговых моделей при классификации текстов. Методы распознавания и синтеза речи.
статья, добавлен 16.07.2021Характеристика предпроектной ситуации. Описание проектирования структуры с учётом исходных данных. Выбор количества каналов и фильтра. Расчёт резисторов для усилителей. Структурная схема и алгоритм работы МПУ сбора и первичной обработки информации.
курсовая работа, добавлен 05.01.2018Определение особенностей разработки модели функционирования системы: диаграммы прецедентов, классов, последовательностей и состояний. Выбор средств программной реализации. Разработка пользовательского интерфейса. Описание диалога с пользователем.
курсовая работа, добавлен 08.05.2016Принципы формирования растрового и векторного изображения. Способность растровых форматов нести дополнительную информацию. Проблема сохранения изображений для последующей их обработки. Наиболее распространенные алгоритмы сжатия. Преобразование файлов.
курсовая работа, добавлен 19.04.2011