Анализ алгоритмов для кластеризации текстовых документов
Рассматриваются основные алгоритмы для кластеризации текстовых документов, осуществляется выбор данных для последующего обучения модели основанных на рассматриваемых алгоритмах и проводится анализ метрик. Результирующие метрики по итогам обучения.
Подобные документы
Создание модели автоматизированного биржевого агента, способной зарабатывать на совершении сделок по покупке и продаже финансовых инструментов на бирже. Генетические алгоритмы обучения для построения простых деревьев решений и объединения их в ансамбли.
дипломная работа, добавлен 26.08.2016Статистическое исследование электронных текстовых сообщений на украинском языке с учетом и без учета разделительных знаков и символов разметки текстов. Оценка использования полученных характеристик для повышения степени сжатия текстовых сообщений.
статья, добавлен 04.09.2013Описания технологий слабого искусственного интеллекта. Биологическое происхождение алгоритмов кластеризации. Изучение группы векторов признаков и инициализированных векторов-прототипов. Алгоритмы муравья или оптимизация по принципу муравьиной колонии.
контрольная работа, добавлен 21.12.2016Исследуются процессы синхронизации, протекающие в осцилляторных сетях различной топологии. Оценка локальной и глобальной синхронизации осцилляторов в сети. Способы использования осцилляторных сетей при решении задач кластеризации N-мерных данных.
статья, добавлен 15.01.2019Характеристика и особенности процесса построения нечеткого классификатора, специфика и применение метода субтрактивной кластеризации. Нечеткий классификатор на основе субтрактивной кластеризации. Сущность оптимизации структуры нечеткого классификатора.
статья, добавлен 17.01.2018Анализ структурно-функционального решения интеллектуального хранилища. Индексирование документов как важная операция, обеспечивающая возможности информационного поиска. Особенность адаптации стандартного генетического алгоритма к задаче кластеризации.
статья, добавлен 18.01.2018Создание и редактирование текстовых документов, особенности рисования в MS Word. Общие сведения о табличном процессоре MS Excel: ввод и редактирование данных, работа с формулами. Характеристика компьютерных сетей, их классификация: локальные, Internet.
отчет по практике, добавлен 26.01.2014Требования к функционалу программной реализации, предварительная обработка текстовых данных. Программная реализация, описание логической структуры. Зависимость качества от числа авторов и от объёма текстов. Особенности и значение индексации документов.
курсовая работа, добавлен 05.08.2018Таблицы Microsoft Access. Формы документов Visual Basic. Передвигание данных в текстовых полях к первой записи. Вычисление средних значений данных за четырехлетние периоды. Содержание программы сортировки. Структура файлов, использованных в проекте.
курсовая работа, добавлен 22.08.2011Анализ принципов обучения нейронных сетей, их классификация. Описание алгоритмов обучения искусственных нейронных сетей: правило Хебба и Кохонена, дельта-правило, обратного распространения ошибки, стохастические алгоритмы, машины Больцмана и Коши.
лекция, добавлен 21.09.2017Построение диаграммы с помощью мастера. Корректирование размеров источника данных. Отображение линий сетки на анаграмме. Построение графиков, отображающих связь между X и Y. Форматирование рисунка на листе. Вставка рисунков из коллекции картинок Clip Art.
курсовая работа, добавлен 07.04.2014Анализ модели беспроводной сенсорной сети на основе теории гиперграфов с применением кластеризации сети. Принцип формирования пикосети. Понятие производного радиуса кластера. Использование не совместимых алгоритмов управления информационными потоками.
статья, добавлен 28.02.2017Сбор и агрегация исторических данных о регулярных рейсах авиакомпаний. Особенность создания модели машинного обучения для предсказания вероятности отмены маршрута. Характеристика формирования ИТ-сервиса для предоставления доступа к предиктивной модели.
дипломная работа, добавлен 09.08.2018Разработка метода мониторинга внутренних процессов университета, основанного на анализе текстовых сообщений в Интернете. Основные этапы обработки неструктурированной информации в социальных сетях. Инжиниринг новых знаний при анализе текстовых сообщений.
статья, добавлен 03.05.2019Рассмотрение стандартов, регламентирующих выбор метрик информационной безопасности системы. Архитектура Oracle E-Business Suite. Рассмотрение базовых свойств метрик и алгоритма выбор метрик, целостности данных системы безопасности для ERP-систем.
статья, добавлен 30.04.2018Виды систем и алгоритмов шифрования. Электронная (цифровая) подпись — это аналог рукописной подписи. Она выполняет ту же функцию — обеспечивает юридическую значимость для документов. Алгоритм электронной цифровой подписи. Процесс подписания документов.
реферат, добавлен 30.05.2023Информационные технологии документационного обеспечения управленческой деятельности. Компьютерные технологии подготовки текстовых документов. Характеристика особенностей обработки экономической информации на основе систем управления базами данных.
реферат, добавлен 20.02.2014Универсальность двоичного кодирования информации в компьютере. Методы классификации экономической информации. Двоичное кодирование – один из распространенных способов представления информационных данных. Перекодировка текстовых документов на компьютере.
реферат, добавлен 29.06.2015Понятие и необходимость кодирования информации. Кодирование двоичным кодом целых и действительных чисел, текстовых данных, графической и звуковой информации. Универсальная система кодирования текстовых данных. Понятие и методы шифрования информации.
реферат, добавлен 11.11.2015Понятие и виды текстовых редакторов. Основы форматирования документа: выбор параметров страницы, форматирование абзацев, символов, таблиц, списков. Компьютерные словари и системы машинного перевода текста. Системы оптического распознавания документов.
контрольная работа, добавлен 25.01.2016Анализ вопроса получения количественных метрик ER-диаграмм проектируемых баз данных с целью последующей оценки их сложности и прогнозирования сроков реализации проекта. Метрические характеристики для представленного примера ER-диаграммы в нотации Чена.
статья, добавлен 31.07.2018Общие сведения и обзор текстовых редакторов как самостоятельных компьютерных программ для создания и изменения текстовых данных. Проектирование приложения, читающего форматы doc и rtf; реализация его основных особенностей; интерфейс пользователя.
курсовая работа, добавлен 04.05.2014- 123. Основы работы в Word
Ввод, редактирование и обработка текстовых документов с различной информацией. Основные параметры форматирования. Способы создания текстового документа в Word. Изменение положения курсора клавишами или манипулятором мышь в пределах набранного текста.
реферат, добавлен 23.06.2015 Нейронная сеть – система связанных и взаимодействующих друг с другом искусственных нейронов. В статье проведен анализ алгоритмов обучения нейронных сетей. Приведены последовательность действий при обучении этими алгоритмами, их достоинства и недостатки.
статья, добавлен 23.01.2021Создание текстовых документов как один из наиболее распространённых способов использования компьютеров. Технология построения реляционной базы данных в программном приложении Microsoft Access. Порядок формирования адресов и имен серверов в Интернете.
курс лекций, добавлен 29.09.2014