Методы извлечения информации из текста
Существующие методы извлечения информации из текстовых данных. Способы извлечения сущностей и отношений. Описание методов автоматического построения онтологий по корпусу, а также способов их оценки. Идентификация фактов, локализованных во времени.
Подобные документы
Методы символьного машинного обучения как перспективный подход к автоматическому построению правил извлечения информации из текста. Основные операции, на которые опираются эти методы — обобщение и специализация, их особенности при извлечении информации.
статья, добавлен 17.01.2018Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.
дипломная работа, добавлен 30.10.2017Проблема обработки данных в публичном доступе глобальной сети интернет. Способы извлечения информации из слабоструктурированных веб страниц. Программное обеспечение для автоматизации процесса извлечения информации из наукометрических баз данных.
статья, добавлен 29.01.2016Извлечение смысловой информации из необработанного текста и его представление в виде RDF графов для дальнейших исследований. Взаимодействие компонентов системы извлечения информации. Обработка графа зависимостей и дерева грамматического разбора.
статья, добавлен 29.09.2012Подходы к определению информации. Методы извлечения информации из сообщения. Способы восприятия информации. Основные разновидности искаженной информации. Программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.
реферат, добавлен 28.01.2015Современные тенденции в области автоматизации процесса сбора информации из интернет-источников. Способы построения (верстки) WEB-сайтов. Метод извлечения информации из слабоструктурированных источников, основанный на XML и принципы его реализации.
статья, добавлен 18.01.2018Обоснование потребности в разработке новых эффективных методов быстрого извлечения и индексирования текстовой информации из видеопотоков. Разработка алгоритма, способного выполнять быструю локализацию и распознавание графического текста на видео.
статья, добавлен 30.07.2020Изучение методов успешного поиска информации в сети Интернет без построения индекса, основываясь только на локальной информации. Описание технологии извлечения содержимого веб-страниц. Характеристика преобразования содержимого страниц с помощью TF-IDF.
дипломная работа, добавлен 28.08.2016Особенности функционирования систем извлечения информации из текстов на естественном языке. Метрики проекта TIPSTER и программы TIDES, их достоинства и недостатки. Использование метрик для оценки качества функционирования систем семейства OntosMiner.
статья, добавлен 17.01.2018Техники анализа большого количества постоянно прибывающей информации. Специфика больших данных. Традиционные методы работы с массивами информации. Программные инструменты для извлечения данных из внешних источников и обработки огромных массивов.
реферат, добавлен 17.09.2014Статистические методы извлечения сущностей, их классификация и отличительные особенности. Именованные сущности как объект лингвистического исследования. Описание работы алгоритма для векторизации слов с учетом морфологических и синтаксических признаков.
дипломная работа, добавлен 10.12.2019Рассмотрение методов и средств извлечения знаний с учетом оценки качества моделей в системах поддержки принятия решений. Возможности совместного эффективного использования экспертных систем, интеллектуального анализа данных, машинного логического вывода.
статья, добавлен 17.05.2020Анализ механизмов пространственной интеграции локальных зрительных признаков. Разработка способа извлечения наиболее информативных составляющих изображения, базирующегося на психофизиологических представлениях о зрительных механизмах группирования.
статья, добавлен 29.06.2017Исследование и сравнительный анализ различных методов синтаксического анализа информации, хранящейся в XML-файлах. Анализ результатов тестирования методов парсинга на различных контрольных выборках документов, при разном объеме извлекаемых данных.
статья, добавлен 17.02.2021Процесс разработки программы автоматизированного извлечения табличных данных из документов формата PDF в документы формата Excel. Описание библиотек для создания рабочей версии программного продукта. Разработка пользовательского интерфейса программы.
дипломная работа, добавлен 04.12.2019- 16. Система извлечения и анализа текстовых данных из социальных сетей для образовательного учреждения
Употребление инструментов, предоставляемых социальными сетями и мессенджерами, для построения системы анализа больших данных для поддержки работы образовательной организации. Применение методов обработки естественного языка (natural language processing).
статья, добавлен 14.02.2022 Понятие автоматического реферирования текста. Взаимосвязь между КП, автоматически сгенерированным рефератом. Разработка программы извлечения ключевых предложений из текста. Изучение пользовательского интерфейса. Проведение оценки качества работы системы.
курсовая работа, добавлен 30.09.2016Заимствование понятия онтологии из философии, его активное использование в настоящее время в искусственном интеллекте и информатике. Разработка декларативных методов автоматического построения онтологий с использованием продукционной модели знаний.
автореферат, добавлен 14.02.2018Ключевые компоненты систем извлечения информации из текста. Средства описания контекста целевой информации и средства описания и использования знаний о предметной области. Особенности развития этих компонентов на основе реализации в системе ИСИДА-Т.
статья, добавлен 17.01.2018Описание PHP - языка программирования, используемого на стороне WEB-сервера для динамической генерации HTML-страниц, его функциональное значение, возможности и актуальность. Пример занесения информации в базу данных MySQL, ее сохранения и извлечения.
курсовая работа, добавлен 31.10.2012Современные методы стеганографического шифрования. Методы сокрытия информации в текстовых файлах, в аудио/видео файлах, методы сокрытия информации в графических файлах. Совмещение криптографии и стеганографии. Лексическое встраивание скрытой информации.
статья, добавлен 07.01.2016Виды информационных процессов. Роль технических устройств как посредников в информационном общении людей. Особенности процессов получения, передачи, обработки и хранения информации. Основные средства и способы извлечения информации из внешних носителей.
презентация, добавлен 04.12.2013Лингвистические особенности организации ФИС (формулы изобретения на способ). Возможности переиспользования интерфейса системы автоматического синтеза формулы изобретения для определения запроса к системе автоматического поиска патентных текстов.
автореферат, добавлен 30.04.2018Угрозы информации, способы их воздействия на объекты защиты информации. Защита информации, традиционные меры и методы защиты информации, а также нетрадиционные методы защиты информации. Методы защиты информации в сетях предприятия, скрытые возможности.
реферат, добавлен 09.12.2009Обзор подходов к решению задачи извлечения именованных сущностей по фармакологической и химической тематике. Описание архитектуры системы, ее составных частей, этапов подготовки программного обеспечения, выбор модулей и признаков для машинного обучения.
диссертация, добавлен 26.08.2016