Сравнение моделей представления слов в задаче очистки текста от обесцененной лексики

Поиск эффективного метода для удаления нецензурных слов или выражений из текстов, статей и некоторых интернет-страниц. Формальная постановка задачи. Описание данных и используемых мер близости. Составление коллекции и разметка, программная реализация.

Подобные документы

  • Изучение методов успешного поиска информации в сети Интернет без построения индекса, основываясь только на локальной информации. Описание технологии извлечения содержимого веб-страниц. Характеристика преобразования содержимого страниц с помощью TF-IDF.

    дипломная работа, добавлен 28.08.2016

  • Описание принципов построения хороших логических моделей данных. Представление знаний с использованием семантических сетей. Оценка различных способов поиска и обмена информацией в Интернет. Преимущества и недостатки поисковых машин, принцип их работы.

    отчет по практике, добавлен 26.05.2016

  • Требования к функционалу программной реализации, предварительная обработка текстовых данных. Программная реализация, описание логической структуры. Зависимость качества от числа авторов и от объёма текстов. Особенности и значение индексации документов.

    курсовая работа, добавлен 05.08.2018

  • Семантическая сеть представления знаний как ориентированный граф, в узлах которого находятся имена объектов и стрелки указывают на отношения между ними. Автоматизированное построение семантической сети. Программная реализация метода представления знаний.

    статья, добавлен 17.02.2019

  • Поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, как с коллекциями текстовых документов в научной области. Понятие онтологии, соотношение смыслов поиска и языковых слов, используемых в запросе.

    статья, добавлен 10.05.2022

  • Концептуальное представление задачи как системы. Программная реализация представления концептуальной модели задачи. Решение задач посредством прямого расчета. Метод полного перебора. Разрешение концептуальных моделей. Составление и решение судоку.

    курсовая работа, добавлен 24.07.2013

  • Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.

    дипломная работа, добавлен 01.12.2019

  • Формальная теория представления и обработки данных в системе управления базами данных (СУБД). Признаки, положенные в основу классификации ЛВС. Анализ особенностей и этапов построения адреса ресурса в Сети Интернет. Сущность эвристического моделирования.

    контрольная работа, добавлен 06.06.2011

  • Особенности анализа структуры научных статей, анализ и описание информационного графа по матрице смежности. Характеристика графового метода определения структурированности текстов. Привлечение графовых моделей в системах автоматического анализа текстов.

    статья, добавлен 14.11.2020

  • Ввод/вывод как передача данных между ядром ЭВМ, включающий в себя микропроцессор и основную память, и внешними устройствами. Программная модель внешнего устройства и принцип ее работы. Способы передачи слов информации по линиям данных, их особенности.

    практическая работа, добавлен 19.02.2014

  • Обзор программной реализации методов приближенного определения решений задач теории игр, представленных в матричной форме. Реализация метода фиктивного разыгрывания игры в системе программирования Delphi. Поиск оптимальных стратегий поведения игроков.

    статья, добавлен 31.07.2018

  • Лексика как раздел науки о словарном составе языка. Роль слов в языке. Лексическая терминология: омонимы, антонимы, синонимы, диалектные слова. Примеры. Способы образования слов. Морфология: части речи и их роль в языке. Формальная модель синтаксиса.

    реферат, добавлен 22.11.2008

  • Алгоритм абстрактного синтеза автомата Мура: составление и разметка регулярных выражений, минимизация числа внутренних состояний, составление отмеченной таблицы переходов. Структурная схема автомата, кодирование состояний, типы используемых триггеров.

    курсовая работа, добавлен 14.10.2010

  • Ознакомление с современными интернет-технологиями. Вопросы разработки и создания современного Web-сайта. Способы представления на Web-страницах различных видов информации (текстов и изображений). Структура Web-страниц. Инструкции для пользователей.

    курсовая работа, добавлен 17.02.2019

  • Содержательное описание структур данных и основные алгоритмы. Сохранение данных об исходном тексте. Алгоритм разбора строки на слова. Алгоритм подсчета повторяющихся слов в тексте. Выделение слов из строки. Использование динамических структур данных.

    курсовая работа, добавлен 02.12.2018

  • Подсчет ключевых слов, употребленных поэтом в его произведениях с помощью специальной компьютерной программы. Принцип составления базы данных полученных ключевых слов для электронного словаря. Разработка электронного словаря ключевых слов, его функции.

    дипломная работа, добавлен 30.11.2016

  • Формулировка требований к оформлению, функционалу, ресурсам сайта, описание и характеристика целевой аудитории. Выбор серверной части, проектирование базы данных. Разработка административной и клиентской части, продвижение и управление сайтом в Интернете.

    курсовая работа, добавлен 29.12.2014

  • Описание использованных структур данных. Функциональное описание процедур и функций. Характеристика структуры приложения и интерфейса пользователя. Анализ временных характеристик и выводы. Особенности работы программы по проверке синтаксиса слов.

    курсовая работа, добавлен 07.07.2012

  • Структурная схема защиты информации в ЛВС. Потенциальные угрозы безопасности информации и средства ее защиты. Шифрование трафика сети. Практическая реализация алгоритма и постановка задачи. Описание состава программных средств и модулей программы.

    дипломная работа, добавлен 26.04.2010

  • Типология методов поиска. Виды соединения с сетью Интернет. Технологии поиска с использованием тематических каталогов. Поиск информации с использованием ключевых слов. Владение пользовательскими инструментами и техникой. Язык запросов поисковой системы.

    курсовая работа, добавлен 29.02.2016

  • Характеристика модели организации бинарной ассоциативной связи между лексемами, основанная на метрической оценке степени близости. Примеры применения этой модели в задаче генерации псевдолитературных текстов. Построение пар бинарных псевдоассоциаций.

    статья, добавлен 17.01.2018

  • Технологии поиска информации в сети Интернет. Понятие языка запросов. Основные способы поиска информации. Два вида поисковых машин. Наиболее популярные поисковые машины Интернета. Исключение из поиска ненужных слов. Применение гипертекстовых ссылок.

    разработка урока, добавлен 22.11.2015

  • Проблемы разработки графовых баз данных в условиях быстро растущего объема генерируемых и обрабатываемых данных. Анализ особенностей графовых моделей данных. Постановка задачи о разработке нового способа представления графов в памяти компьютера.

    статья, добавлен 29.07.2017

  • Разработка технического проекта, постановка задачи и требований. Методологии моделирования баз данных в интернете. Построение логической и функциональной схемы сайта. Рассмотрение и описание прецедентов. Реализация проекта информационной системы.

    курсовая работа, добавлен 23.12.2013

  • Обзор существующих систем для автоматизации работы автомобильных стоянок. Постановка задачи, используемые компоненты и программная реализация. Интерфейсы, службы и поддерживающие форматы данных. Обеспечение интероперабельности и мобильности приложений.

    курсовая работа, добавлен 19.12.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.