Система комплексного анализа русскоязычных текстовых сообщений на платформе IBM InfoSphere Streams

Анализ методов предварительной обработки текстовых сообщений, способов классификации и кластеризации. Программы определения тональности текста. Представление текста в виде дерева синтаксического разбора. Разработка системы анализа текстовой информации.

Подобные документы

  • Анализ тональности текста, определение и происхождение понятия, цели, основные свойства и области применения. Подходы к классификации тональности. Машинное обучение с учителем и без, тестирование различных параметров. Классификаторы и выбор признаков.

    реферат, добавлен 23.03.2015

  • Классификация продуктов, выполняющих кластеризацию текстовой информации. Описание платформ RapidMiner, SAS analytics, Demantra, IBM SPSS Modeler, STATISTICA Text Miner. Выбор лучшего программного продукта среди аналогов с помощью метода Т. Саати.

    статья, добавлен 07.11.2018

  • Текст: представление, хранение, ввод. Оформление, структурирование, автоматизированная обработка и системы автоматизированной доработки текста. Понятие “текстового файла”. Пример текстовых редакторов. Параметры характеристики и основные виды шрифта.

    курсовая работа, добавлен 23.01.2017

  • Интеллектуальный анализ данных, группировка схожих документов в отдельные кластеры. Проведение исследований по кластеризации текстовых данных: предварительная обработка, векторизация, запуск алгоритма машинного обучения и оценка качества разбиения.

    дипломная работа, добавлен 30.06.2017

  • Понятие электронного документа, преимущества электронного документооборота. Возможности текстовых процессоров, стандартные средства форматирования текста. Основные функции текстовых редакторов, программ для создания презентаций и работ с таблицами.

    реферат, добавлен 11.02.2015

  • Рассмотрение различных методов восстановления текстовой информации при возникновении искажений в процессе передачи ее по каналам связи низкого качества. Восстановление текста за счет смысловой избыточности как один из наиболее часто используемых методов.

    статья, добавлен 10.03.2018

  • Типы программ для создания и редактирования текстовых документов. Типовая структура интерфейса, ее элементы. Возможности обычного текстового редактора. Режим вставки и замены символов. Понятие фрагмента текста и его выделение. Перемещение текста в окне.

    реферат, добавлен 15.06.2015

  • Описание подходов к упорядочению текстов выдачи поисковой системы по близости к запросу с использованием модели машинного обучения, основанной на сравнении деревьев синтаксического разбора. Результаты использования выборки запросов на английском языке.

    статья, добавлен 19.01.2018

  • Обзор современного состояния и тенденция развития систем шифрования коротких сообщений. Разработка мобильного приложения с интуитивным интерфейсом и важными функциями. Обзор методов криптографической защиты сообщений. Функция quarterround в ChaCha.

    дипломная работа, добавлен 03.11.2019

  • Основные задачи использования электронного офиса для обработки информации. Технический состав электронного офиса. Типы текстовых и графических редакторов. Назначение табличных процессоров. Создание электронных презентаций. Оптическое распознавание текста.

    реферат, добавлен 08.03.2016

  • Процесс обработки текста. Элементы теории кодирования. Понятие о кодировании информации. Кодирование текстовой информации байтами. Кодировочные таблицы, стандартная кодировка ASCII. Кодовая таблица Windows (CP-1251). Альтернативная кодовая таблица.

    реферат, добавлен 09.10.2009

  • Понятие и необходимость кодирования информации. Кодирование двоичным кодом целых и действительных чисел, текстовых данных, графической и звуковой информации. Универсальная система кодирования текстовых данных. Понятие и методы шифрования информации.

    реферат, добавлен 11.11.2015

  • Ускорение процесса принятия решений в динамических организационных системах, особенно при необходимости обработки большого количества значимых слабоструктурированных текстовых данных. Обработка слабоструктурированных текстовых данных на русском языке.

    статья, добавлен 03.04.2023

  • Разработка программы для лексического и синтаксического анализа на языке программирования Visual C. Исследование процесса построения таблицы переходов-выходов. Характеристика методов трансляции. Изучение способов построения формальной грамматики.

    курсовая работа, добавлен 16.06.2013

  • Классификация информации и её свойства. История обработки информации. Современные системы обработки информации. Проблемы связанные с обработкой информации. Обработка текстовой информации в автоматизированных системах. Текстовые редакторы и процессоры.

    реферат, добавлен 20.05.2009

  • Разработка классификаторов и кодификаторов информации, печатных документов и экранных форм. Структура файлов базы данных и передаваемых сообщений, разработка технологического процесса обработки информации с целью повышения качества работы обслуживания.

    курсовая работа, добавлен 02.06.2020

  • Характеристика "Тетриса" как культовой компьютерной игры, изобретённой в СССР А. Пажитновым. Графический интерфейс операционной системы Windows. Создание и регистрация класса окна. Цикл обработки сообщений. Система координат, основанная на пикселях.

    курсовая работа, добавлен 12.01.2014

  • Назначение и классификация текстовых редакторов, принципы их работы. Автоматизация процессов ввода и редактирования текста. Создание множества программ для обработки документов. Отрабатывание первичных навыков взаимодействия с компьютерной системой.

    реферат, добавлен 14.02.2017

  • Системный анализ лексики текстов и определение связи основных лексических конструкций с их значением. Формулирование на основе данного анализа правил сопоставления синтактико-грамматической и семантической моделей текста на естественном языке.

    статья, добавлен 28.01.2020

  • Создание и обработка текстовых документов. Текстовый редактор: назначение и основные возможности. Создание и обработка числовой информации средствами электронных таблиц. Создание и обработка графической информации. Назначение графических редакторов.

    курсовая работа, добавлен 04.06.2012

  • Краткая история развития кодировок, разновидности программ, позволяющих осуществлять обработку текстовой информации. Исследование программы Microsoft Word как наиболее распространенного редактора документов, использующего технологии обработки информации.

    реферат, добавлен 19.06.2013

  • Определение понятия и анализ структуры банка данных как организованной системы применения информации. Раскрытие сущности технологии обработки текстовых документов. Оценка назначения и изучение видов криптографических методов защиты. Деловая информация.

    курсовая работа, добавлен 04.04.2012

  • Понятие автоматического реферирования текста. Взаимосвязь между КП, автоматически сгенерированным рефератом. Разработка программы извлечения ключевых предложений из текста. Изучение пользовательского интерфейса. Проведение оценки качества работы системы.

    курсовая работа, добавлен 30.09.2016

  • Основные понятия и определения криптографии и шифрования информации. Криптографические примитивы и программные шифраторы. Шифрование и дешифрование в Net Framework. Алгоритмическая блок-схема процесса криптографии текстовых данных в программной среде.

    курсовая работа, добавлен 07.01.2014

  • Универсальность двоичного кодирования информации в компьютере. Методы классификации экономической информации. Двоичное кодирование – один из распространенных способов представления информационных данных. Перекодировка текстовых документов на компьютере.

    реферат, добавлен 29.06.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.