Разработка и исследование модели нейросетевого метода анализа текстовых документов

Разработка алгоритма формирования информационных образов электронных текстовых документов, включающий механизм сокращения признаков, основанный на подходе к оценке тематической значимости признаков документов. Нейросетевой анализ коллекции документов.

Подобные документы

  • Задачи, сущность и классификация систем подготовки текстовых документов, возможности текстовых редакторов, текстовых процессоров и настольных издательских систем. Минимальный набор типовых операций в процессоре Microsoft Word при подготовке текста.

    курсовая работа, добавлен 23.06.2015

  • Создание и использование архивов электронных документов. Организация учета электронных документов.Обеспечение сохранности электронных документов. Принципы защиты конфиденциальных сведений в архивах. Уничтожение документов с истекшими сроками хранения.

    реферат, добавлен 14.06.2022

  • Определение задачи оптимального представления текстовых документов на заключительном этапе функционирования информационно-поисковой системы. Характеристика основных преимуществ использования алгоритма Куна в составе автоматических поисковых серверов.

    статья, добавлен 26.04.2017

  • Описан состав и функциональные возможности компьютерных систем подготовки текстовых документов, их редактирование и форматирование. Использование пользовательских и системных шаблонов, стилей, методов ввода и языка, установка параметров абзацев и пр.

    реферат, добавлен 09.04.2014

  • Изучение методов получения и обработки статей из электронных научных журналов. Скачивание и обработка библиографических статей. Этапы обработки и анализа текстовых документов. Выбор средств разработки программного комплекса. Парсинг электронных журналов.

    курсовая работа, добавлен 18.12.2016

  • Программы для создания, редактирования и печати документов. Основные функции текстового редактора. Форматы текстовых файлов и их отличия. Относительное форматирование электронных документов. Постепенное вытеснение бумажного документооборота электронным.

    презентация, добавлен 15.03.2015

  • Преимущества использования XML-документов для организации хранилищ слабо структурированных электронных данных. Ознакомление с рецепторами программирования обработки текстовых файлов в веб-приложениях Java EE, функционирующих на базе "Glassfish v3".

    статья, добавлен 29.04.2017

  • Реализация упрощенного алгоритма шинглов для сокращения времени сравнения документов на неоднородной вычислительной системе на базе многоядерных процессоров и Many Integrated Core (MIC) ускорителей. Поэтапная модификация исходной однопоточной программы.

    статья, добавлен 28.07.2017

  • Разработка системы автоматизированной обработки больших объемов динамической текстовой информации. Схемы кластеризации документов по морскому и речному делу. Предварительная обработка электронных текстов. Корректировка обучающего массива и индексирование.

    статья, добавлен 25.12.2016

  • Модель представления структуры и содержимого слабоструктурированных текстовых документов в виде совокупности объектов. Два типа объектов: атомарные объекты и объекты контейнеры, а также свойства и отношения, в которых они могут находиться между собой.

    статья, добавлен 19.06.2018

  • Информационные технологии и функциональная модель процесса анализа документов в организации. Автоматизация рабочего места социолога в процессе анализа документов в организации. Программно-аппаратное обеспечение анализа документов в организации.

    курсовая работа, добавлен 24.04.2015

  • Состав и функциональные возможности компьютерных систем подготовки текстовых документов, технология подготовки на основе применения текстового процессора. Состав и назначение операций редактирования. Возможности и особенности технологии подготовки.

    контрольная работа, добавлен 07.04.2014

  • Операции по работе с текстом (ввод, редактирование, форматирования). Текстовые редакторы, текстовые процессоры как средство создания документов. Форматирование текста и других текстовых документов в текстовом процессоре. Корректура и печать документов.

    презентация, добавлен 24.10.2018

  • Теоретические аспекты языков описания электронных документов. HTML, SGML, XML форматы. Подход Dublin Core, проект SHOE, онтология DoCO. Разработка предметно-ориентированного языка описания структуры и содержания электронных документов в EDocSACD.

    дипломная работа, добавлен 14.07.2016

  • Нормативно-законодательные требования к информационной безопасности и обеспечению юридической значимости электронных документов. Анализ статистики утечек и разработка системы защиты информации от копирования, требования к ней и анализ возможностей.

    статья, добавлен 30.05.2017

  • Поиск информации и задача извлечения документов. Коллекция документов на естественном языке. Выбор из коллекции документов, релевантных запросу. Отличия естественного языка от искусственного. Принципы формирования запроса. Информационная потребность.

    презентация, добавлен 01.09.2013

  • Ручной подбор схемы взвешивания для коллекции документов. Вычисление полноты, точности и аккуратности алгоритма. Основные преимущества и недостатки модификации с генетическим алгоритмом. Эффективность использования векторной модели для ранжирования.

    статья, добавлен 30.05.2017

  • Роль нормативно-правовой и технической базы в организации архивного хранения электронных документов. Особенности обеспечения сохранности архивного хранения документов. Опыт в организации хранения электронных документов: проблемы, практика, рекомендации.

    курсовая работа, добавлен 22.04.2022

  • Проблемы внедрения системы электронного документооборота в учреждениях. Зaдaчи учета требований информaционной безопaсности при проектировaнии хрaнилищ электронных документов. Исследовaние разных систем конфиденциaльного хрaнения электронных документов.

    статья, добавлен 10.02.2019

  • Разработка математических моделей текстов на естественном языке предназначенных для поиска, классификации и кластеризации данных. Таксономическое представление текстовых документов в виде решетки замкнутых структурных синтактико-семантических описаний.

    диссертация, добавлен 28.12.2016

  • Рассмотрение двухфазной технологии формирования и генерации выходных документов информационных систем, основанной на универсальном текстовом процессоре MS Word. Отладка процедур формирования выходных документов. Создание собственного отчета на MS Word.

    статья, добавлен 30.03.2017

  • Классификационные группы средств организационной техники. Классификация и выбор конкретной модели определенного вида оргтехники. Средства подготовки текстовых и табличных документов. Обработка и хранения документов в офисе, картотечное оборудование.

    курсовая работа, добавлен 05.11.2010

  • Специфика современного документооборота. Требования к информационной безопасности и обеспечению юридической значимости электронных документов. Методы защиты передаваемых данных по компьютерным сетям, обеспечение секретности и подлинности сообщений.

    статья, добавлен 30.04.2019

  • Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.

    статья, добавлен 17.01.2018

  • Классификация текстовых процессоров: процессоры общего назначения, редакторы научных документов и исходных текстов программ, издательские системы. Характеристика отдельных текстовых процессоров: Лексикон, AbiWord, OpenOffice.org Writer, Microsoft Word.

    курсовая работа, добавлен 13.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.