Модель слабоструктурированных текстовых документов

Модель представления структуры и содержимого слабоструктурированных текстовых документов в виде совокупности объектов. Два типа объектов: атомарные объекты и объекты контейнеры, а также свойства и отношения, в которых они могут находиться между собой.

Подобные документы

  • Возможности текстовых процессоров, их функции и принципы использования. Обработка документов с текстом в текстовых редакторах Лексикон, Word Pad, WordPerfect, Microsoft Word 6.0 и Microsoft Word 2003. Пользовательский интерфейс. Вид окна и приемы работы.

    реферат, добавлен 04.02.2009

  • Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.

    дипломная работа, добавлен 30.06.2017

  • Основное назначение и классификация текстовых редакторов, параметры оценки удобства работы. Методы вставки внешних объектов. Текстовый редактор Microsoft Word, его характеристика. Главное назначение и функции текстовых редакторов Лексикон и Word Pad.

    контрольная работа, добавлен 08.05.2011

  • Проблема обработки данных в публичном доступе глобальной сети интернет. Способы извлечения информации из слабоструктурированных веб страниц. Программное обеспечение для автоматизации процесса извлечения информации из наукометрических баз данных.

    статья, добавлен 29.01.2016

  • Проведение исследования основных признаков, характерных для баз данных. Проведение библиографического розыска и отбора документов для ввода в информационную модель. Порядок контроля и оценки программы. Анализ полнотекстового поиска в текстовых файлах.

    контрольная работа, добавлен 20.08.2017

  • Современные тенденции в области автоматизации процесса сбора информации из интернет-источников. Способы построения (верстки) WEB-сайтов. Метод извлечения информации из слабоструктурированных источников, основанный на XML и принципы его реализации.

    статья, добавлен 18.01.2018

  • Программы для создания, редактирования и печати документов. Основные функции текстового редактора. Форматы текстовых файлов и их отличия. Относительное форматирование электронных документов. Постепенное вытеснение бумажного документооборота электронным.

    презентация, добавлен 15.03.2015

  • Преимущества использования XML-документов для организации хранилищ слабо структурированных электронных данных. Ознакомление с рецепторами программирования обработки текстовых файлов в веб-приложениях Java EE, функционирующих на базе "Glassfish v3".

    статья, добавлен 29.04.2017

  • Ознакомление с сущностью текстовых редакторов и текстовых процессоров. Изучение особенностей настройки рабочего поля текстового процессора Word. Рассмотрение и анализ правил набора текста. Характеристика основных видов форматирования документов Word.

    реферат, добавлен 23.03.2021

  • Рассмотрение задачи аспектного анализа тональности текстовых сообщений на естественном языке. Исследование четырех нейросетевых моделей, относящихся к разделу глубокого обучения, результаты проверки моделей на корпусе текстовых отзывов SentiRuEval-2015.

    статья, добавлен 27.05.2018

  • Основы работы с операционными системами типа Windows. Создание текстовых документов с помощью Microsoft Word. Программирование в среде Turbo Pascal. Проведение численных и символьных расчетов в Mathcad. Программирование алгоритмов циклической структуры.

    учебное пособие, добавлен 19.05.2016

  • Информационная модель — совокупность информации, характеризующая существенные свойства и состояния объекта, процесса, явления, а также взаимосвязь с внешним миром; типы моделей. Информационные системы управления объектами на примере работы АСУ АТП.

    реферат, добавлен 24.01.2012

  • Назначение первичных, промежуточных и выходных документов, формирующихся и движущихся при реализации информационных процессов, включенных в разрабатываемую модель, оформленных в виде реестра. Методика "Сущность-связь" в системе управления базами дынных.

    курсовая работа, добавлен 06.05.2018

  • Особенности представления данных на мониторе компьютера в графическом виде. Преимущества и недостатки векторной графики как средства сохранения изображений объектов, для которых имеет значение четкость контуров. Виды объектов векторной иллюстрации.

    реферат, добавлен 10.11.2015

  • Реализация и описание метода обнаружения текстовых регионов на изображении с использованием модифицированного детектора FASText. Сравнение интенсивности рядом лежащих пикселей между собой для определения ширины штриха и поиска специфичных ключевых точек.

    статья, добавлен 29.07.2018

  • Классификационные группы средств организационной техники. Классификация и выбор конкретной модели определенного вида оргтехники. Средства подготовки текстовых и табличных документов. Обработка и хранения документов в офисе, картотечное оборудование.

    курсовая работа, добавлен 05.11.2010

  • Объекты и классы языка Java. Программы, создающие собственные классы. Описание классов, объектов, методов и функций. Абстрактные, окончательные, статистические и вложенные методы и классы, а также конструктор класса. Статическая переменная и ее изменения.

    лабораторная работа, добавлен 30.06.2009

  • Создание и редактирование документов. Различные форматы текстовых файлов. Форматирование документа: параметры страницы, абзацы, списки, таблицы. Компьютерные словари и системы машинного перевода текста. Системы оптического распознавания документов.

    курсовая работа, добавлен 20.01.2012

  • Комплекс технологических операций и связей, информационное взаимодействие между ними. Упрощенная модель алгоритма создания стереоанимационного ролика. Представление всех объектов в матричном виде, применение математического аппарата для обработки.

    статья, добавлен 25.08.2020

  • Основные системы подготовки текстовых документов. Определение сущности текстового редактора, текстового процессора и настольных издательских систем. Обзор пакета прикладных программ Microsoft Office. Автоматизация документационного обеспечения управления.

    курсовая работа, добавлен 14.08.2011

  • Изучение свойств, характеристик и способов задания алгоритма. Рассмотрение линейных, разветвляющихся и циклических вычислительных процессов. Описание работы с пакетами обработки текстовых документов. Ознакомление с устройствами ввода информации.

    контрольная работа, добавлен 01.02.2014

  • Реализация упрощенного алгоритма шинглов для сокращения времени сравнения документов на неоднородной вычислительной системе на базе многоядерных процессоров и Many Integrated Core (MIC) ускорителей. Поэтапная модификация исходной однопоточной программы.

    статья, добавлен 28.07.2017

  • Изучение методов получения и обработки статей из электронных научных журналов. Скачивание и обработка библиографических статей. Этапы обработки и анализа текстовых документов. Выбор средств разработки программного комплекса. Парсинг электронных журналов.

    курсовая работа, добавлен 18.12.2016

  • Статистическое исследование электронных текстовых сообщений на украинском языке с учетом и без учета разделительных знаков и символов разметки текстов. Оценка использования полученных характеристик для повышения степени сжатия текстовых сообщений.

    статья, добавлен 04.09.2013

  • Разработка системы автоматизированной обработки больших объемов динамической текстовой информации. Схемы кластеризации документов по морскому и речному делу. Предварительная обработка электронных текстов. Корректировка обучающего массива и индексирование.

    статья, добавлен 25.12.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.