Основные этапы обработки текста и генерации признаков в задачах текстовой классификации
Этапы проведения обработки текстовых признаков в задачах интеллектуального анализа данных. Процедура генерации информативных факторов. Операции стемминга, формирования мешка слов, формирования статистики TF-IDF. Методы сокращения пространства признаков.
Подобные документы
Показано, что анализ тональности текстовой информации входит в область задач компьютерной лингвистики и является подзадачей получения и обработки информации. Исследован процесс анализа тональности текста, реализуемого с помощью тонального словаря.
статья, добавлен 15.01.2019Характеристика программных средств статистической обработки результатов в образовании: программное обеспечение для статистического анализа данных (виды статистических пакетов, возможности программы STADIA, сущность метода проекта и этапы реализации).
курсовая работа, добавлен 28.06.2015Методы проектирования технологических процессов обработки данных. Проектирование технологических процессов обработки данных в пакетном режиме. Характеристика технологических процессов обработки данных в диалоговом режиме. Классификация диалоговых систем.
реферат, добавлен 18.03.2018Методы представления и обработки знаний в интеллектуальных системах диагностирования. Исследование метода оптимизации бинарных деревьев решений путем уменьшения размерности дерева и определения несущественных атрибутов (диагностических признаков).
статья, добавлен 19.06.2018Разработка модели мониторинга мнений пользователей социальных сетей с поддержкой автоматизированного анализа данных. Применение алгоритмов интеллектуальной обработки текстовой информации. Распознавание и удаление спама. Машинное обучение без учителя.
статья, добавлен 27.05.2018- 81. Система извлечения и анализа текстовых данных из социальных сетей для образовательного учреждения
Употребление инструментов, предоставляемых социальными сетями и мессенджерами, для построения системы анализа больших данных для поддержки работы образовательной организации. Применение методов обработки естественного языка (natural language processing).
статья, добавлен 14.02.2022 Разработка теоретических и реализационных основ анализа и обработки разнородных данных о пространственно-распределенных объектах региональной инфраструктуры на основе создания и внедрения геоинформационных систем. Экспериментальные исследования системы.
автореферат, добавлен 13.02.2018Характеристика признаков и назначения слабоструктурированных баз данных. Сущность платформы XML – модульной системы функционально-специализированных взаимосвязанных совместимых языков предоставления информационных ресурсов. Виды пространства имен XML.
статья, добавлен 13.10.2012Сущность, понятие и сферы применения интеллектуальных систем. Методика логической обработки информационных данных, особенности экспертных систем как программного обеспечения, их основные функции, этапы проектировано и характеристики эксплуатации.
контрольная работа, добавлен 05.11.2014Понятие и виды текстовых редакторов. Основы форматирования документа: выбор параметров страницы, форматирование абзацев, символов, таблиц, списков. Компьютерные словари и системы машинного перевода текста. Системы оптического распознавания документов.
контрольная работа, добавлен 25.01.2016Метод формирования информационных признаков информационной модели конфликтных ситуаций. Его предназначение для решения задач проектирования системы информационного обеспечения процессов принятия решений оператором при управлении динамическими системами.
статья, добавлен 26.02.2017Создание классификационных и описательных шкал. Сбор исходной фактографической информации и ее ввод в систему обучающей выборки. Оценка ценности признаков для прогнозирования. Выделение признаков, наиболее существенных для решения поставленной задачи.
статья, добавлен 25.04.2017Создание и редактирование документов. Различные форматы текстовых файлов. Форматирование документа: параметры страницы, абзацы, списки, таблицы. Компьютерные словари и системы машинного перевода текста. Системы оптического распознавания документов.
курсовая работа, добавлен 20.01.2012Описание технологии обработки текстовых, графических и табличных данных. Характеристика гипертекстовой технологии представления информации. Мультимедиа – интерактивная технология, обеспечивающая работу с неподвижными изображениями, текстом и звуком.
реферат, добавлен 16.03.2014Основные этапы развития автоматизированных информационных технологий (АИТ) как совокупности методов и средств обработки и хранения информации. Критерии классификации АИТ, характеристика видов. Электронный и виртуальный офисы. Пакетная и диалоговая АИТ.
презентация, добавлен 26.01.2015Детерминистские и статистические методы распознавания образов. Построение решающих правил. Кластерный анализ. Отбор и их оценка информативных признаков. Правило ближайшего соседа. Параметрическое оценивание распределений. Критерий Неймана-Пирсона.
курс лекций, добавлен 01.10.2013Интеграция автоматизированных систем управления предприятием (АСУП) с системами уровня предприятия и бизнес-приложениями. Методы кодирования для сжатия цифровых изображений в модульных структурах. Использование статистических признаков при моделировании.
статья, добавлен 25.08.2020Общее понятие данных. Процедуры обработки данных в зависимости от видов представления данных. Организационные формы использования информационных технологий при обработке данных. Особенности и технологический процесс обработки экономической информации.
курсовая работа, добавлен 08.05.2014Разработка системы автоматизированной обработки больших объемов динамической текстовой информации. Схемы кластеризации документов по морскому и речному делу. Предварительная обработка электронных текстов. Корректировка обучающего массива и индексирование.
статья, добавлен 25.12.2016Метод формирования логических правил базы знаний экспертной системы. Логические ассоциативные правила, их формирование путём выделения из имеющегося покрытия, которое удовлетворяет определённому значению поддержки информативных информационных признаков.
статья, добавлен 29.06.2016Возможности текстовых процессоров, их функции и принципы использования. Обработка документов с текстом в текстовых редакторах Лексикон, Word Pad, WordPerfect, Microsoft Word 6.0 и Microsoft Word 2003. Пользовательский интерфейс. Вид окна и приемы работы.
реферат, добавлен 04.02.2009Возможности программы, разработанной для проведения экспериментов, связанных с исследованием влияния энтропии текстовой информации на психоэмоциональное состояние человека. Обработка данных, представленных в виде смысловых текстовых конструкций.
статья, добавлен 29.04.2019Понятие и основные элементы юридической обработки документов и правовой информации. Классификация документов, этапы их обработки. Выявление взаимосвязей, составление примечаний и справочных сведений к документу. Юридический анализ информационного банка.
курсовая работа, добавлен 29.11.2014Особенности семантического распознавания информационных объектов в сведениях, доступных через Web. Обнаружение устройств в Internet of Things, Web-сервисов и поддержка информационной службы экстренного вызова. Анализ обработки на семантическом уровне.
статья, добавлен 30.01.2017Организационная структура системы государственной статистики Российской Федерации. Комплексы электронной обработки информации - одна из организационно-технологических форм автоматизированного решения задачи обработки данных статистической отчетности.
курсовая работа, добавлен 14.04.2015