Метод автоматизированного извлечения знаний из слабоструктурированных источников и его применение для создания корпоративных информационных систем
Современные тенденции в области автоматизации процесса сбора информации из интернет-источников. Способы построения (верстки) WEB-сайтов. Метод извлечения информации из слабоструктурированных источников, основанный на XML и принципы его реализации.
Подобные документы
Классификация источников Интернет по способу представления информации, языковому, территориальному признаку, по виду и характеру представляемой информации. Использование публикаций исторических источников в сети Интернет. Интернет как источник информации.
статья, добавлен 06.10.2015Существующие методы извлечения информации из текстовых данных. Способы извлечения сущностей и отношений. Описание методов автоматического построения онтологий по корпусу, а также способов их оценки. Идентификация фактов, локализованных во времени.
статья, добавлен 26.04.2019Описание архитектуры и базовых функциональных возможностей средств распределенного приобретения знаний. Совместное использование источников знаний различной типологии. Структурирование полученной от эксперта информации. Процедура уточнения описаний.
статья, добавлен 19.01.2018Анализ технологий построения моделей систем извлечения информации из глобальной сети. Информационно-поисковая система, основанная на онтологиях, для извлечения и семантического представления структурированной информации из неструктурированного текста.
автореферат, добавлен 25.07.2018Исследование динамики роста объемов информации в мире. Роль и средства извлечения знаний из информационно-телекоммуникационных потоков. Цели создания локальных и глобальных компьютерных сетей. Разработка концепции роботизированных поисковых систем.
статья, добавлен 19.12.2017Техники анализа большого количества постоянно прибывающей информации. Специфика больших данных. Традиционные методы работы с массивами информации. Программные инструменты для извлечения данных из внешних источников и обработки огромных массивов.
реферат, добавлен 17.09.2014Понятие и особенности процесса передачи информации, существующие на сегодняшний день способы ее реализации. Использование сетевых информационных технологий для передачи информации. Интернет и правила работы с ним, основные понятие и закономерности.
реферат, добавлен 21.11.2010Описание методов поиска угроз веб-приложений с помощью открытых источников информации в сети Интернет. Статистика безопасности веб-приложений и их характеристика. Способы получения закрытой информации на примере использования современных поисковых систем.
статья, добавлен 19.12.2017Идея коммуникации ученых и инженеров в США. Создание гипертекстовой системы сайтов. Способы организации доступа к сайтам, появление поисковых систем. История создания корпоративных информационных порталов. Корпоративное использование сети Интернет.
статья, добавлен 23.03.2018Сравнительный анализ различных технологий и решений в области контейнеризации. Повышение эффективности разработки, эксплуатации веб-краулеров за счет автоматизации процессов управления системой сбора данных, основывающейся на применении ПО типа "краулер".
дипломная работа, добавлен 28.11.2019Подходы к определению информации. Методы извлечения информации из сообщения. Способы восприятия информации. Основные разновидности искаженной информации. Программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.
реферат, добавлен 28.01.2015Ключевые компоненты систем извлечения информации из текста. Средства описания контекста целевой информации и средства описания и использования знаний о предметной области. Особенности развития этих компонентов на основе реализации в системе ИСИДА-Т.
статья, добавлен 17.01.2018Методы и модели описания информационных систем. Обобщенная структурная схема системы передачи информации. Определение количества информации. Информационные характеристики источников дискретных сообщений. Классификация сигналов и методов модуляции.
шпаргалка, добавлен 11.09.2012Анализ механизмов пространственной интеграции локальных зрительных признаков. Разработка способа извлечения наиболее информативных составляющих изображения, базирующегося на психофизиологических представлениях о зрительных механизмах группирования.
статья, добавлен 29.06.2017Особенности функционирования систем извлечения информации из текстов на естественном языке. Метрики проекта TIPSTER и программы TIDES, их достоинства и недостатки. Использование метрик для оценки качества функционирования систем семейства OntosMiner.
статья, добавлен 17.01.2018Ускорение процесса принятия решений в динамических организационных системах, особенно при необходимости обработки большого количества значимых слабоструктурированных текстовых данных. Обработка слабоструктурированных текстовых данных на русском языке.
статья, добавлен 03.04.2023Изучение методов успешного поиска информации в сети Интернет без построения индекса, основываясь только на локальной информации. Описание технологии извлечения содержимого веб-страниц. Характеристика преобразования содержимого страниц с помощью TF-IDF.
дипломная работа, добавлен 28.08.2016Анализ методов создания большинства информационных систем. Некоторые проблемы объединения всей информации на одном крупном портале. Основные признаки, по которым можно выделить распределенные сети сайтов среди большинства различных интернет-ресурсов.
статья, добавлен 29.07.2018Извлечение смысловой информации из необработанного текста и его представление в виде RDF графов для дальнейших исследований. Взаимодействие компонентов системы извлечения информации. Обработка графа зависимостей и дерева грамматического разбора.
статья, добавлен 29.09.2012Представление знаний, разработка их систем, стратегия получения и практические методы извлечения. Виды и технологии интеллектуальных информационных систем. Задачи формирования и формализация баз знаний. Автоматизированные системы распознавания образов.
контрольная работа, добавлен 18.12.2009Метод решения проблем с множеством источников неопределенности информации. Применение аспектов теории вероятностей в экспертных системах. Коэффициенты уверенности и условные вероятности. Подход с использованием нечеткой логики и теории функций доверия.
статья, добавлен 26.08.2010Сайт как метод представления информации в интернете, их классификация. Список наиболее известных программ для создания сайтов. Услуги по предоставлению дискового пространства для физического размещения файлов на сервере провайдера, виды хостинга.
контрольная работа, добавлен 10.05.2015Анализ методов загрузки информации из хранилища источников в информационную систему приемника данных. Выбор инструмента извлечения данных и их преобразования перед загрузкой в место назначения. Реализация ETL-процесса на базе платформы 1С:Предприятие.
статья, добавлен 18.01.2021Общее представление о видах электронных источников информации. Классификация сетевых ресурсов по назначению и информационному содержанию сайтов. Рассмотрение преимуществ и недостатков использования интернета в процессе дистанционной научной работы.
реферат, добавлен 21.04.2015Применение технологии экспертных систем для контроля правильности работы программных средств и баз данных. Особенности процесса наблюдения и сбора информации в вычислительной среде. Способы защиты информации. Составление схемы управления безопасностью.
статья, добавлен 20.05.2017