Сравнение моделей представления слов в задаче очистки текста от обесцененной лексики
Поиск эффективного метода для удаления нецензурных слов или выражений из текстов, статей и некоторых интернет-страниц. Формальная постановка задачи. Описание данных и используемых мер близости. Составление коллекции и разметка, программная реализация.
Подобные документы
Изучение методов успешного поиска информации в сети Интернет без построения индекса, основываясь только на локальной информации. Описание технологии извлечения содержимого веб-страниц. Характеристика преобразования содержимого страниц с помощью TF-IDF.
дипломная работа, добавлен 28.08.2016Описание принципов построения хороших логических моделей данных. Представление знаний с использованием семантических сетей. Оценка различных способов поиска и обмена информацией в Интернет. Преимущества и недостатки поисковых машин, принцип их работы.
отчет по практике, добавлен 26.05.2016Требования к функционалу программной реализации, предварительная обработка текстовых данных. Программная реализация, описание логической структуры. Зависимость качества от числа авторов и от объёма текстов. Особенности и значение индексации документов.
курсовая работа, добавлен 05.08.2018Семантическая сеть представления знаний как ориентированный граф, в узлах которого находятся имена объектов и стрелки указывают на отношения между ними. Автоматизированное построение семантической сети. Программная реализация метода представления знаний.
статья, добавлен 17.02.2019Поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, как с коллекциями текстовых документов в научной области. Понятие онтологии, соотношение смыслов поиска и языковых слов, используемых в запросе.
статья, добавлен 10.05.2022Концептуальное представление задачи как системы. Программная реализация представления концептуальной модели задачи. Решение задач посредством прямого расчета. Метод полного перебора. Разрешение концептуальных моделей. Составление и решение судоку.
курсовая работа, добавлен 24.07.2013Исследование методов Transfer Learning для семантического анализа и их сравнение на данных, содержащих упоминания компании Тинькофф Банк на различных Интернет-ресурсах. Реализация моделей для классификации текстов с использованием различных метрик.
дипломная работа, добавлен 01.12.2019Формальная теория представления и обработки данных в системе управления базами данных (СУБД). Признаки, положенные в основу классификации ЛВС. Анализ особенностей и этапов построения адреса ресурса в Сети Интернет. Сущность эвристического моделирования.
контрольная работа, добавлен 06.06.2011Особенности анализа структуры научных статей, анализ и описание информационного графа по матрице смежности. Характеристика графового метода определения структурированности текстов. Привлечение графовых моделей в системах автоматического анализа текстов.
статья, добавлен 14.11.2020Ввод/вывод как передача данных между ядром ЭВМ, включающий в себя микропроцессор и основную память, и внешними устройствами. Программная модель внешнего устройства и принцип ее работы. Способы передачи слов информации по линиям данных, их особенности.
практическая работа, добавлен 19.02.2014Обзор программной реализации методов приближенного определения решений задач теории игр, представленных в матричной форме. Реализация метода фиктивного разыгрывания игры в системе программирования Delphi. Поиск оптимальных стратегий поведения игроков.
статья, добавлен 31.07.2018Лексика как раздел науки о словарном составе языка. Роль слов в языке. Лексическая терминология: омонимы, антонимы, синонимы, диалектные слова. Примеры. Способы образования слов. Морфология: части речи и их роль в языке. Формальная модель синтаксиса.
реферат, добавлен 22.11.2008Алгоритм абстрактного синтеза автомата Мура: составление и разметка регулярных выражений, минимизация числа внутренних состояний, составление отмеченной таблицы переходов. Структурная схема автомата, кодирование состояний, типы используемых триггеров.
курсовая работа, добавлен 14.10.2010- 14. Разработка сайта
Ознакомление с современными интернет-технологиями. Вопросы разработки и создания современного Web-сайта. Способы представления на Web-страницах различных видов информации (текстов и изображений). Структура Web-страниц. Инструкции для пользователей.
курсовая работа, добавлен 17.02.2019 Содержательное описание структур данных и основные алгоритмы. Сохранение данных об исходном тексте. Алгоритм разбора строки на слова. Алгоритм подсчета повторяющихся слов в тексте. Выделение слов из строки. Использование динамических структур данных.
курсовая работа, добавлен 02.12.2018Подсчет ключевых слов, употребленных поэтом в его произведениях с помощью специальной компьютерной программы. Принцип составления базы данных полученных ключевых слов для электронного словаря. Разработка электронного словаря ключевых слов, его функции.
дипломная работа, добавлен 30.11.2016Формулировка требований к оформлению, функционалу, ресурсам сайта, описание и характеристика целевой аудитории. Выбор серверной части, проектирование базы данных. Разработка административной и клиентской части, продвижение и управление сайтом в Интернете.
курсовая работа, добавлен 29.12.2014Описание использованных структур данных. Функциональное описание процедур и функций. Характеристика структуры приложения и интерфейса пользователя. Анализ временных характеристик и выводы. Особенности работы программы по проверке синтаксиса слов.
курсовая работа, добавлен 07.07.2012Структурная схема защиты информации в ЛВС. Потенциальные угрозы безопасности информации и средства ее защиты. Шифрование трафика сети. Практическая реализация алгоритма и постановка задачи. Описание состава программных средств и модулей программы.
дипломная работа, добавлен 26.04.2010- 20. Поиск информации
Типология методов поиска. Виды соединения с сетью Интернет. Технологии поиска с использованием тематических каталогов. Поиск информации с использованием ключевых слов. Владение пользовательскими инструментами и техникой. Язык запросов поисковой системы.
курсовая работа, добавлен 29.02.2016 Характеристика модели организации бинарной ассоциативной связи между лексемами, основанная на метрической оценке степени близости. Примеры применения этой модели в задаче генерации псевдолитературных текстов. Построение пар бинарных псевдоассоциаций.
статья, добавлен 17.01.2018Технологии поиска информации в сети Интернет. Понятие языка запросов. Основные способы поиска информации. Два вида поисковых машин. Наиболее популярные поисковые машины Интернета. Исключение из поиска ненужных слов. Применение гипертекстовых ссылок.
разработка урока, добавлен 22.11.2015Проблемы разработки графовых баз данных в условиях быстро растущего объема генерируемых и обрабатываемых данных. Анализ особенностей графовых моделей данных. Постановка задачи о разработке нового способа представления графов в памяти компьютера.
статья, добавлен 29.07.2017Разработка технического проекта, постановка задачи и требований. Методологии моделирования баз данных в интернете. Построение логической и функциональной схемы сайта. Рассмотрение и описание прецедентов. Реализация проекта информационной системы.
курсовая работа, добавлен 23.12.2013Обзор существующих систем для автоматизации работы автомобильных стоянок. Постановка задачи, используемые компоненты и программная реализация. Интерфейсы, службы и поддерживающие форматы данных. Обеспечение интероперабельности и мобильности приложений.
курсовая работа, добавлен 19.12.2017