Разработка и исследование модели нейросетевого метода анализа текстовых документов
Разработка алгоритма формирования информационных образов электронных текстовых документов, включающий механизм сокращения признаков, основанный на подходе к оценке тематической значимости признаков документов. Нейросетевой анализ коллекции документов.
Подобные документы
Задачи, сущность и классификация систем подготовки текстовых документов, возможности текстовых редакторов, текстовых процессоров и настольных издательских систем. Минимальный набор типовых операций в процессоре Microsoft Word при подготовке текста.
курсовая работа, добавлен 23.06.2015Создание и использование архивов электронных документов. Организация учета электронных документов.Обеспечение сохранности электронных документов. Принципы защиты конфиденциальных сведений в архивах. Уничтожение документов с истекшими сроками хранения.
реферат, добавлен 14.06.2022Определение задачи оптимального представления текстовых документов на заключительном этапе функционирования информационно-поисковой системы. Характеристика основных преимуществ использования алгоритма Куна в составе автоматических поисковых серверов.
статья, добавлен 26.04.2017Описан состав и функциональные возможности компьютерных систем подготовки текстовых документов, их редактирование и форматирование. Использование пользовательских и системных шаблонов, стилей, методов ввода и языка, установка параметров абзацев и пр.
реферат, добавлен 09.04.2014Изучение методов получения и обработки статей из электронных научных журналов. Скачивание и обработка библиографических статей. Этапы обработки и анализа текстовых документов. Выбор средств разработки программного комплекса. Парсинг электронных журналов.
курсовая работа, добавлен 18.12.2016Программы для создания, редактирования и печати документов. Основные функции текстового редактора. Форматы текстовых файлов и их отличия. Относительное форматирование электронных документов. Постепенное вытеснение бумажного документооборота электронным.
презентация, добавлен 15.03.2015Преимущества использования XML-документов для организации хранилищ слабо структурированных электронных данных. Ознакомление с рецепторами программирования обработки текстовых файлов в веб-приложениях Java EE, функционирующих на базе "Glassfish v3".
статья, добавлен 29.04.2017Реализация упрощенного алгоритма шинглов для сокращения времени сравнения документов на неоднородной вычислительной системе на базе многоядерных процессоров и Many Integrated Core (MIC) ускорителей. Поэтапная модификация исходной однопоточной программы.
статья, добавлен 28.07.2017Разработка системы автоматизированной обработки больших объемов динамической текстовой информации. Схемы кластеризации документов по морскому и речному делу. Предварительная обработка электронных текстов. Корректировка обучающего массива и индексирование.
статья, добавлен 25.12.2016Модель представления структуры и содержимого слабоструктурированных текстовых документов в виде совокупности объектов. Два типа объектов: атомарные объекты и объекты контейнеры, а также свойства и отношения, в которых они могут находиться между собой.
статья, добавлен 19.06.2018Информационные технологии и функциональная модель процесса анализа документов в организации. Автоматизация рабочего места социолога в процессе анализа документов в организации. Программно-аппаратное обеспечение анализа документов в организации.
курсовая работа, добавлен 24.04.2015Состав и функциональные возможности компьютерных систем подготовки текстовых документов, технология подготовки на основе применения текстового процессора. Состав и назначение операций редактирования. Возможности и особенности технологии подготовки.
контрольная работа, добавлен 07.04.2014Операции по работе с текстом (ввод, редактирование, форматирования). Текстовые редакторы, текстовые процессоры как средство создания документов. Форматирование текста и других текстовых документов в текстовом процессоре. Корректура и печать документов.
презентация, добавлен 24.10.2018- 14. Разработка предметно-ориентированного языка описания структуры и содержания электронных документов
Теоретические аспекты языков описания электронных документов. HTML, SGML, XML форматы. Подход Dublin Core, проект SHOE, онтология DoCO. Разработка предметно-ориентированного языка описания структуры и содержания электронных документов в EDocSACD.
дипломная работа, добавлен 14.07.2016 Нормативно-законодательные требования к информационной безопасности и обеспечению юридической значимости электронных документов. Анализ статистики утечек и разработка системы защиты информации от копирования, требования к ней и анализ возможностей.
статья, добавлен 30.05.2017Поиск информации и задача извлечения документов. Коллекция документов на естественном языке. Выбор из коллекции документов, релевантных запросу. Отличия естественного языка от искусственного. Принципы формирования запроса. Информационная потребность.
презентация, добавлен 01.09.2013Ручной подбор схемы взвешивания для коллекции документов. Вычисление полноты, точности и аккуратности алгоритма. Основные преимущества и недостатки модификации с генетическим алгоритмом. Эффективность использования векторной модели для ранжирования.
статья, добавлен 30.05.2017Роль нормативно-правовой и технической базы в организации архивного хранения электронных документов. Особенности обеспечения сохранности архивного хранения документов. Опыт в организации хранения электронных документов: проблемы, практика, рекомендации.
курсовая работа, добавлен 22.04.2022Проблемы внедрения системы электронного документооборота в учреждениях. Зaдaчи учета требований информaционной безопaсности при проектировaнии хрaнилищ электронных документов. Исследовaние разных систем конфиденциaльного хрaнения электронных документов.
статья, добавлен 10.02.2019Разработка математических моделей текстов на естественном языке предназначенных для поиска, классификации и кластеризации данных. Таксономическое представление текстовых документов в виде решетки замкнутых структурных синтактико-семантических описаний.
диссертация, добавлен 28.12.2016- 21. Двухфазная технология формирования выходных документов в информационных системах на основе MS WORD
Рассмотрение двухфазной технологии формирования и генерации выходных документов информационных систем, основанной на универсальном текстовом процессоре MS Word. Отладка процедур формирования выходных документов. Создание собственного отчета на MS Word.
статья, добавлен 30.03.2017 Классификационные группы средств организационной техники. Классификация и выбор конкретной модели определенного вида оргтехники. Средства подготовки текстовых и табличных документов. Обработка и хранения документов в офисе, картотечное оборудование.
курсовая работа, добавлен 05.11.2010Специфика современного документооборота. Требования к информационной безопасности и обеспечению юридической значимости электронных документов. Методы защиты передаваемых данных по компьютерным сетям, обеспечение секретности и подлинности сообщений.
статья, добавлен 30.04.2019Исследование применения алгоритмов Data Mining для поиска кластеров дубликатов с использованием синтаксических и лексических методов составления образов документов. Программная реализация и компьютерные эксперименты. Способ выбора параметров методов.
статья, добавлен 17.01.2018Классификация текстовых процессоров: процессоры общего назначения, редакторы научных документов и исходных текстов программ, издательские системы. Характеристика отдельных текстовых процессоров: Лексикон, AbiWord, OpenOffice.org Writer, Microsoft Word.
курсовая работа, добавлен 13.06.2011