Обработка исходных данных коллекции ClueWeb12

Изучение методов успешного поиска информации в сети Интернет без построения индекса, основываясь только на локальной информации. Описание технологии извлечения содержимого веб-страниц. Характеристика преобразования содержимого страниц с помощью TF-IDF.

Подобные документы

  • Описание PHP - языка программирования, используемого на стороне WEB-сервера для динамической генерации HTML-страниц, его функциональное значение, возможности и актуальность. Пример занесения информации в базу данных MySQL, ее сохранения и извлечения.

    курсовая работа, добавлен 31.10.2012

  • Рассмотрение теоретических основ современных интернет технологий. Ознакомление с возможностями подключения к сети. Изучение принципов поиска информации в интернете. Обзор современных интернет браузеров. Маршрутизация электронной информации в сети.

    реферат, добавлен 22.09.2014

  • Анализ требований к хранению, передаче и использованию данных. Характеристика структуры и типа локальной вычислительной сети. Выбор аппаратных элементов, методов маршрутизации информации, а также построения и использования адресного пространства сети.

    курсовая работа, добавлен 07.08.2017

  • Страницы WWW (Word Wide Web), графические вставки, видео- и звуковые данные. Стилевое и шрифтовое оформление страниц WWW, язык разметки гипертекста HTML (Hyper Markup Language). Современные средства создания страниц WWW работают в режиме WYSIWYG.

    реферат, добавлен 18.03.2010

  • Система передачи информации. Физическая среда передачи информации. Технологии передачи данных на физическом уровне. Способы подключения к сети Интернет. Настройка модема АDSL при подключении к сети Интернет. Построение сети на основе топологии FTTH.

    методичка, добавлен 10.11.2017

  • Основные понятия и особенности технологий создания интерактивных WEB-страниц. Методика размещения собственных страниц в интернете и их обслуживание. Понятие, характеристика и общие принципы работы интернета. Редактирование и обновление WEB-страниц.

    реферат, добавлен 04.11.2012

  • Основные характеристики локальной сети: размеры, технологии передачи данных и топологии их построения. Преимущества структурированной кабельной системы. Передача информации в кольце. Виды локальных сетей. Техника безопасности при работе за компьютером.

    реферат, добавлен 10.11.2013

  • Исследование системы методов, подходов и идей обменом информации (данных), процессов ее восприятия, передачи, поиска, и отображения. Изучение природы и свойств информационных процессов - создание методов их обработки и организация хранения данных.

    контрольная работа, добавлен 09.02.2009

  • Обработка большого объема информации на предприятиях с помощью персонального компьютера в совокупности с хорошим программным обеспечением и создание для этого локальной вычислительной сети. Хранение необходимой информации в виде базы данных на сервере.

    курсовая работа, добавлен 18.01.2014

  • Интернет как средство реструктуризации общества и основных сфер общественной жизни: экономики, науки и политики. Специфические черты информации в сети Интернет. Преимущества и полезность использования Интернета для поиска экономической информации.

    реферат, добавлен 28.04.2010

  • История создания и развития сети Интернет и электронной почты. Процесс и протокол передачи гипертекста. Программа-браузер для просмотра интернет-страниц. WWW-серверы: единый информационный ресурс. Использование технологии DSL. Скорость передачи данных.

    реферат, добавлен 05.12.2012

  • Характеристика и функции поисковой системы - информационной системы с элементами автоматизации, которая осуществляет поиск интернет страниц по запросам пользователя. Принципы работы системы поиска, учитывающей не только текст запроса, но и его окружение.

    статья, добавлен 28.02.2019

  • Описание и формализация технологии передачи и обработки информации. Характеристика основных этапов обработки информации, общей концепции программы для обработки данных о студентах, анализ её состава и структуры. Изучение функциональной схемы программы.

    курсовая работа, добавлен 29.09.2015

  • Доступ к глобальной компьютерной сети World Wide Web и навигация с помощью web-браузеров. Основные принципы построения web-страниц и эффективность использования программного обеспечения. Язык разметки гипертекстов, текстовые и графические редакторы.

    курсовая работа, добавлен 27.08.2010

  • Типология методов поиска. Виды соединения с сетью Интернет. Технологии поиска с использованием тематических каталогов. Поиск информации с использованием ключевых слов. Владение пользовательскими инструментами и техникой. Язык запросов поисковой системы.

    курсовая работа, добавлен 29.02.2016

  • Этапы разработки проекта Web-приложения, серверного и клиентского ПО: регистрация доменного имени, размещение Web-сервера, его установка и настройка; обработка исходных материалов, верстка и программирование страниц HTML, тестирование и эксплуатация.

    реферат, добавлен 25.02.2010

  • Характеристика сайта в Интернете как массива связанных данных, имеющий уникальный адрес и воспринимаемый пользователем как единое целое. Анализ назначения сайта, разработка его структуры, описание основных страниц, особенностей размещения информации.

    отчет по практике, добавлен 23.11.2016

  • Быстрое увеличение объема информации в интернете. Структура его информационного пространства. Схема информационных потоков. Модель web-пространства. Пропорции четырех основных категорий web-страниц. Пример рускоязычной базы данных. Платные сайты.

    презентация, добавлен 10.03.2015

  • Облачные технологии - виртуальное хранение и обработка информации, обеспечивающие безопасность данных. Структура вычислительных облаков: аппаратные средства, программное обеспечение, связь. Преимущества облачной информации при наличии выхода в Интернет.

    статья, добавлен 16.02.2019

  • Механизмы обмена массивами данных между клиентом и сервером с помощью сети Интернет в условиях увеличения объема обрабатываемой информации. Методы решения проблем связанных с отказоустойчивостью и масштабируемостью при двухзвенной сетевой архитектуре.

    статья, добавлен 28.05.2017

  • Пути защиты информации в системах обработки данных, в ПЭВМ. Сущность идентификации и аутентификации. Анализ методов защиты информации в ЛВС. Каналы утечки информации. Обзор программного обеспечения для проектирования локальной вычислительной сети.

    дипломная работа, добавлен 22.02.2013

  • Характеристика особенностей онтологического подхода для решения задач поиска информации в семантическом пространстве. Исследование методов распознавания текстовой информации в сети интернет для составления единого концепта ассоциации предметных областей.

    статья, добавлен 30.01.2016

  • Проблема поиска и сбора информации в интернете. Обзор современных информационно-поисковых систем. Автоматический просмотр узлов сети и сбор необходимой информации. Повышение результативности поиска и отбора необходимых данных в специальной базе.

    реферат, добавлен 24.09.2014

  • Технологии построения абонентской части сети. Требования к организации локальной проводной сети. Физическая топология и выбор оптимальной конфигурации. Защита информации методами частотной модуляции и кодирования от несанкционированного доступа.

    курсовая работа, добавлен 29.06.2012

  • Изучение возможностей по оформлению документов организации с помощью средств Word 7.0: заголовки, оглавление, нумерация страниц, списки, сноски и таблицы. Характеристика технологий электронных таблиц Excel 7.0: формулы, вычисления, экономические расчеты.

    методичка, добавлен 29.11.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.