Статистические характеристики текстовых сообщений украинского языка и использование их для сжатия информации

Статистическое исследование электронных текстовых сообщений на украинском языке с учетом и без учета разделительных знаков и символов разметки текстов. Оценка использования полученных характеристик для повышения степени сжатия текстовых сообщений.

Подобные документы

  • Создание и передача блока информации, защищённого секретным ключом. Методы симметричного шифрования и построения криптографически стойких хэш-функций. Использования хэш-кода для получения МАС. Базовые алгоритмы хэширования компьютерных сообщений.

    дипломная работа, добавлен 23.04.2014

  • Информация как количественная мера изменений состояния материальных объектов и философская категория. Виды, формы и функции передаваемых сообщений. Характеристика текстовых графических документов. Способы копирования, распространения и хранения данных.

    статья, добавлен 20.05.2018

  • Стандартизация взаимодействия между автоматизированными системами и программными приложениями расчетной системы Банка России - цель разработки унифицированных форматов электронных банковских сообщений. Анализ платежного документооборота на базе XML.

    контрольная работа, добавлен 08.08.2015

  • Использование среды разработки приложений Visual Studio 2017 и языка программирования C# для создания программы "Шифр Цезаря". Разработка программы шифрования методом Цезаря. Программа шифрования и дешифрования текстовых сообщений с помощью шифра Цезаря.

    курсовая работа, добавлен 17.11.2020

  • Назначение программы для создания и редактирования текстовых документов. Характеристики и классификация текстовых редакторов по возможностям и типу файлов. Структура интерфейса рассматриваемого самостоятельного компьютерного компонента Office Word.

    реферат, добавлен 04.02.2015

  • Возможности текстовых процессоров, их функции и принципы использования. Обработка документов с текстом в текстовых редакторах Лексикон, Word Pad, WordPerfect, Microsoft Word 6.0 и Microsoft Word 2003. Пользовательский интерфейс. Вид окна и приемы работы.

    реферат, добавлен 04.02.2009

  • Разработка алгоритма формирования информационных образов электронных текстовых документов, включающий механизм сокращения признаков, основанный на подходе к оценке тематической значимости признаков документов. Нейросетевой анализ коллекции документов.

    автореферат, добавлен 31.07.2018

  • Спектры сигналов и виды модуляции. Цифровые преобразователи. Измерение информации. Дискретные каналы связи. Принципы сжатия сообщений. Понятие кодера и модели. Классификация помехоустойчивых кодов. Контроль и диагностика ошибок в информационных системах.

    курс лекций, добавлен 04.05.2014

  • Анализ текстов для выявления информации, необходимой пользователю, в частности для построения онтологической модели фактов и выявления в построенной модели противоречий. Эффективность реализованных алгоритмов системы анализа сообщений пользователя.

    статья, добавлен 11.03.2019

  • Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации. Каналы передачи сообщений. Обработка информации по принципу "черного ящика". Информационная культура пользователя. Устройства для преобразования сообщений.

    презентация, добавлен 27.03.2018

  • Рассмотрение понятия условной энтропии в теории информации. Определение избыточности сообщений. Построение оптимальных кодов при помощи методик Шенона-Хано и Хаффмена. Обнаружение и исправление ошибок в сообщениях. Описание методов сжатия информации.

    курс лекций, добавлен 18.02.2013

  • Понятие и необходимость кодирования информации. Кодирование двоичным кодом целых и действительных чисел, текстовых данных, графической и звуковой информации. Универсальная система кодирования текстовых данных. Понятие и методы шифрования информации.

    реферат, добавлен 11.11.2015

  • Информация, ее виды и свойства. Алгоритмы сжатия текстов и файлов неизвестного формата. Программные средства для сжатия данных - архиваторы. Сжатие данных с потерями информации. Преимущество методов сжатия с потерями над методами сжатия без потерь.

    реферат, добавлен 07.05.2012

  • Оценка противоречий в нечеткой многоуровневой системе продукций. Продуктивность применения методики для проведения семантического анализа структурной и содержательной связности особого рода текстов, представленных в виде наборов текстовых импликатов.

    статья, добавлен 30.04.2018

  • Системы исчисления и двоичное представление информации в памяти компьютера. Процесс кодирования текстовых данных. Нахождение информационного объема сообщения. Представление целых чисел в вычислительной машине. Арифметические операции над величинами.

    контрольная работа, добавлен 31.01.2014

  • Использование текстовых процессоров и редакторов для создания документа. Редактирование и форматирование текста, минимальный и расширенный набор типовых операций; вставка таблиц, работа с графической информацией. Операции сохранения текста, распечатка.

    реферат, добавлен 13.04.2013

  • Разработка информационной технологии локализации текста на изображении со сложным фоном (ИСФ). Анализ метода локализации текстовых областей на ИСФ на базе сверточной нейронной сети с учетом многомасштабного разложения изображения по вейвлет-базису.

    статья, добавлен 22.12.2016

  • Основные подходы к сбору и обработке текстовых данных. Подходы к очистке табличных текстовых данных. Скрапинг веб-сайтов и работа с API. Реализация алгоритмов обработки данных ветеринарных сайтов. Сбор источников данных по рынку ветеринарных услуг Москвы.

    дипломная работа, добавлен 07.12.2019

  • Расчет (написание программы) методом Шеннона-Фано оптимальных двоичных кодов сообщений данного источника информации. Программы, выполняющие кодирование и декодирование. Энтропия и избыточность источника информации. Ожидаемый коэффициент сжатия данных.

    курсовая работа, добавлен 04.05.2015

  • Виды социологической информации. Обработка социологических данных с применением компьютеров и специализированных пакетов программ. Примеры применения различных программ для обработки текстовых данных. Связи между понятиями в текстовых полях базы данных.

    презентация, добавлен 09.10.2013

  • Назначение и классификация текстовых редакторов, типовая структура интерфейса и работа с документами. Возможности редакторов Microsoft Notepad и WordPad. Сравнительная характеристика и отличительные черты MS Office Word 2007-2010, новые возможности.

    дипломная работа, добавлен 25.03.2012

  • Основные понятия и определения криптографии и шифрования информации. Криптографические примитивы и программные шифраторы. Шифрование и дешифрование в Net Framework. Алгоритмическая блок-схема процесса криптографии текстовых данных в программной среде.

    курсовая работа, добавлен 07.01.2014

  • Изучение научной литературы по проблеме гипертекста. Разработка языка гипертекстовой разметки HTML. Анализ отформатированного текста или рисунка, содержащего скрытый адрес другого ресурса в web. Характеристика текстовых и графических гиперссылок.

    статья, добавлен 14.10.2018

  • Описание элементов языка Фортран GNS, ориентированного на программирование параллельных вычислительных процессов методом передачи сообщений. Идентификация отправителей и получателей. Структура элементов списка передаваемых сообщений; конструкция выбора.

    научная работа, добавлен 28.10.2018

  • Виды и характеристики технических средств информатизации, применяемые на предприятии. Операционные системы и оболочки, сервисные продукты. Использование текстовых редакторов, электронных таблиц, баз данных и технических средств обработки информации.

    отчет по практике, добавлен 25.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.