Извлечение информации из слабоструктурированных веб-страниц

Проблема обработки данных в публичном доступе глобальной сети интернет. Способы извлечения информации из слабоструктурированных веб страниц. Программное обеспечение для автоматизации процесса извлечения информации из наукометрических баз данных.

Подобные документы

  • Классификация источников Интернет по способу представления информации, языковому, территориальному признаку, по виду и характеру представляемой информации. Использование публикаций исторических источников в сети Интернет. Интернет как источник информации.

    статья, добавлен 06.10.2015

  • Правовое обеспечение, лицензирование и сертификация в области защиты информации. Комплексная система защиты информации. Сущность организационных, программных и аппаратных средств защиты. Методы защиты информации от несанкционированного доступа.

    контрольная работа, добавлен 23.11.2009

  • Проект базы данных для хранения информации о гражданах. Разработка запросов, форм, отчетов базы данных, предназначенных для просмотра, редактирования, вывода информации. Создание глобальной схемы связей и удобного интерфейса. Поддержка целостности данных.

    творческая работа, добавлен 25.10.2017

  • Изучение организационных и технологических аспектов целостности данных. Особенность методов защиты при помощи программных паролей или шифрования информации. Компьютерные вирусы, их свойства и классификация. Охрана сведений в глобальной сети Internet.

    лекция, добавлен 30.09.2015

  • Постановка проблемы защиты данных и анализ существующих средств защиты информации. Изучение методов физической защиты данных: кабельная система, система электроснабжения и дублирования информации. Особенности программно-технических средств защиты данных.

    реферат, добавлен 20.10.2009

  • Количественные и качественные методы сбора социологической информации. Проектирование информационной системы проведения и обработки результатов социологического исследования. Автоматизация ввода первичной информации и обработки полученных данных.

    курсовая работа, добавлен 15.03.2019

  • Изучение вопроса организации поиска информации в сети Интернет. Рассмотрение основных методов и средств поиска информации. Расширенные возможности обычного поиска поисковой системы Google. Разработка поисковых машин и алгоритмов поиска информации.

    статья, добавлен 17.07.2018

  • Рассмотрение проблемы поиска научной информации в условиях больших объемов данных сети Интернет, содержащих значительное количество шумовой информации. Взаимосвязь между семантическим пространством исследователя и эффективностью поиска научной информации.

    статья, добавлен 20.09.2018

  • Обеспечение качества данных словарей, справочников и классификаторов. Анализ и систематизация основных методов структурирования информации. Создание специального математического и программного обеспечения для хранения информации в реляционной базе данных.

    автореферат, добавлен 02.07.2018

  • Технология, принципы, этапы, режимы и типы автоматизированной обработки экономической информации. Сбор, хранение, обработка и передача информации. Этапы технологического процесса. Автоматические способы сбора и регистрации данных, программа Excel.

    реферат, добавлен 27.02.2009

  • Классификация баз данных по модели представления данных и связи между ними, по организации хранения данных и обращения к ним, по типу хранимой информации. Избыточность информации, логическая и физическая независимость данных. Компоненты банка данных.

    презентация, добавлен 17.04.2013

  • История создания интернета, технические разработки корпорации RAND, высокоскоростная сеть ARPANET. Принципы работы провайдера. Необходимость регулирования содержимого интернет-страниц. Государственный контроль за распространением информации в сети.

    реферат, добавлен 10.03.2010

  • Обоснование потребности в разработке новых эффективных методов быстрого извлечения и индексирования текстовой информации из видеопотоков. Разработка алгоритма, способного выполнять быструю локализацию и распознавание графического текста на видео.

    статья, добавлен 30.07.2020

  • Рассмотрение информационных систем и технологий, а именно: глобальной сети Интернет, электронной почты, телеконференции, файловых архивов, всемирной паутины, возможностей поиска информации в сети, мессенджеров, их значимости в управлении организаций.

    реферат, добавлен 23.02.2014

  • Анализ методов загрузки информации из хранилища источников в информационную систему приемника данных. Выбор инструмента извлечения данных и их преобразования перед загрузкой в место назначения. Реализация ETL-процесса на базе платформы 1С:Предприятие.

    статья, добавлен 18.01.2021

  • Методы обеспечения информационной безопасности в сети Интернет. Назначение экранирующих систем и основные требования к ним, роль аутентификации пользователей и способы управления доступом к информации. Безопасность программной среды и защита Web–серверов.

    курсовая работа, добавлен 29.07.2015

  • Принцип организации информации в сети Интернет. Определение понятия и суть "сервера", "клиента", их взаимодействие в интернете. Базы данных в сети: простейший сервер в БД, WEB сервера, принцип работы с ними и системы доступа к ним через интернет.

    презентация, добавлен 01.04.2014

  • Изучение классификации компьютерных систем, предназначенных для поиска текстовой или графической информации. Механизмы функционирования и целевое предназначение процесса индексирования веб-серверами данных, находящихся в глобальной сети Internet.

    презентация, добавлен 21.11.2015

  • Анализ возможных внешних угроз безопасности информации. Квалификация антропогенных источников информации, мероприятия по недопущению или исключению инцидентов с безопасностью информации. Способы аутентификации пользователей при удаленном доступе.

    дипломная работа, добавлен 02.06.2013

  • Требования к безопасности функционирования компьютерных систем. Правовое обеспечение защиты информации. Определение ценности конфиденциальных коммерческих данных. Уровни защищенности комплекса аппаратных и программных средств обработки информации.

    реферат, добавлен 17.05.2016

  • Появление системных концепций. Основные понятия об Интернете. Технология обработки числовой информации. Электронные калькуляторы и таблицы, их применение. Типы данных: число, текст и формула. Абсолютные и относительные ссылки. Сортировка и поиск данных.

    курсовая работа, добавлен 17.11.2019

  • Анализ базы знаний наукометрических сервисов Scopus, Web of Science, eLIBRARY.RU, Mendeley, SCImago Journal&Country Rank. Возможности пользовательских интерфейсов сервисов, частота обновления данных, получения доступа к информации, принципы работы.

    статья, добавлен 15.12.2021

  • Изучение вопросов правового обеспечения, лицензирования и сертификации в области защиты информации, особенности использования вычислительной техники. Проблемы и способы информационной защиты в автоматизированных системах обработки данных (АСОД).

    реферат, добавлен 21.02.2010

  • Разработка модели программного сервиса, предлагающего услуги для поиска данных о человеке в глобальной сети Интернет по заданным параметрам, с возможностью обработки данных. Архитектура сервиса, программный код клиентского приложения, поисковой программы.

    дипломная работа, добавлен 14.12.2019

  • Анализ защиты систем обработки данных и вычислительных систем от несанкционированного доступа информации. Организационно-технические меры, обеспечивающие секретность информации. Опасность компьютерных вирусов. Механизмы идентификация пользователей.

    реферат, добавлен 22.04.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.