Сравнение моделей представления слов в задаче очистки текста от обесцененной лексики
Поиск эффективного метода для удаления нецензурных слов или выражений из текстов, статей и некоторых интернет-страниц. Формальная постановка задачи. Описание данных и используемых мер близости. Составление коллекции и разметка, программная реализация.
Подобные документы
Постановка задачи навигация движения, описание алгоритма поиска кратчайшего пути между двумя вершинами графа и анализ программной реализации алгоритма Дейкстры. Графическая реализация полученных результатов с помощью объектно-ориентированного языка С++.
курсовая работа, добавлен 11.05.2012Описание истории создания браузеров, возможностей браузеров, основ работы с Internet Explorer. Возможности, предоставляемые сетью интернет. Сохранение веб-страниц, использование автозаполнения. Настройка внешнего вида обозревателя, сравнение браузеров.
реферат, добавлен 26.03.2019Общие сведения о графах. Реализация алгоритма Флойда. Графы и способы их представления. Пути и циклы в графах. Программная реализация алгоритма поиска кратчайшего пути между двумя любыми вершинами графа. Пример применения алгоритма Флойда на практике.
курсовая работа, добавлен 19.11.2011Оператор неранжирующее "И". Поиск текста в заголовке страниц и на сайте. Поиск файлов и определение языка текста, поиск по дате. Скобки в сложных запросах. Анализ и примеры сложных запросов. Перевод запросов с "естественного" языка на язык запросов.
презентация, добавлен 10.03.2015Постановка задачи на разработку программы. Описание алгоритма и (или) функционирования программы, описание и обоснование выбора метода организации входных и выходных данных. Описание и обоснование выбора состава технических и программных средств.
курсовая работа, добавлен 20.09.2014Концептуальное, логическое проектирование базы данных. Модель "сущность-связь", нормализация отношений. Состав таблиц, средства поддержания целостности. Программная реализация базы данных интернет магазина. Заполнение тестовыми данными, создание запросов.
курсовая работа, добавлен 15.06.2017Проблема обработки данных в публичном доступе глобальной сети интернет. Способы извлечения информации из слабоструктурированных веб страниц. Программное обеспечение для автоматизации процесса извлечения информации из наукометрических баз данных.
статья, добавлен 29.01.2016Описание комплексного метода снятия частеречной омонимиии в тексте на русском языке. Сравнительная оценка эффективности классического N-граммного подхода и собранной статистики совместной сочетаемости слов для задачи POS-tagging при комплексном подходе.
статья, добавлен 18.01.2018Методы и условия эффективного поиска в среде Паскаль, преимущества метода дихотомии. Описание методов сортировки массивов со смысловой и стилистической правкой. Сортировка последовательностей и поиск медианы. Сравнение методов сортировки массивов.
курсовая работа, добавлен 17.02.2012Методы извлечения оценочных слов и проставления оценок отзывам. Разработка подхода к оценке отзывов об объекте, основанного на применении оценочных слов из конкретной предметной области. Рассмотрение метода классификации отзывов о фильмах на три класса.
статья, добавлен 18.01.2018Проектирование и программная реализация базы данных "Стоматологическая клиника". Изучение и описание предметной области. Построение инфологической, даталогической и физической моделей. Кнопочная форма как интерфейс программного приложения базы данных.
курсовая работа, добавлен 28.03.2017Системный анализ лексики текстов и определение связи основных лексических конструкций с их значением. Формулирование на основе данного анализа правил сопоставления синтактико-грамматической и семантической моделей текста на естественном языке.
статья, добавлен 28.01.2020Сущность и характеристика графов, их особенности и программная реализация этого алгоритма на языке Turbo Pascal. Спецификация алгоритма и модели поиска данных. Понятие очереди и вершины поиска, составление матриц и массивов программы, их сравнение.
курсовая работа, добавлен 16.02.2015Описание формата подготовки заданий открытой формы тестирования на электронных носителях для автоматизации ввода исходных данных. Программная реализация системы тестирования на основе открытых тестов. Применение Excel для анализа успеваемости студентов.
статья, добавлен 20.01.2018Изложение процесса создания сайта по реализации одежды для животных: обзор сетевых предприятий, занимающихся производством и сбытом одежды для животных; разработка бренд-платформы; программная реализация интернет-магазина и сопутствующих приложений.
дипломная работа, добавлен 08.05.2014Метод анализа совокупности текстов, основанный на автоматическом сравнении языкового материала. Разработка программной реализации алгоритма первичной обработки файлов PDF для их приведения в формат TXT. Выявление повторяющихся последовательностей слов.
статья, добавлен 04.05.2022Описание встроенных элементов управления. Создание, открытие и сохранение БД. Удаление, редактирование, добавление и поиск записи. Изменение формата текста. Поиск и сортировки данных. Построение диаграмм. Краткое описание алгоритма работы с программой.
курсовая работа, добавлен 20.10.2013Понятие, определение и характеристика экономических задач, их постановка и реализация, автоматизация решения. Технологические и функциональные задачи при разработке информационных систем, описание алгоритмов. Содержание документа "Постановка задачи".
лекция, добавлен 18.03.2018Анализ бизнес-процессов внутренней курьерской службы, сравнение ее внешней и внутренней форм. Анализ существующих инструментов для автоматизации, функциональная спецификация. Принципы проектирования графического интерфейса для менеджера и курьеров.
курсовая работа, добавлен 01.08.2017Обзор информационных технологий, подходящих для разработки информационной системы компьютерных курсов. Разработка инфологической модели базы данных (БД) и нормализация схемы. Программная реализация БД: представления, формы, отчеты и ограничения.
курсовая работа, добавлен 30.05.2013Анализ и выбор интернет-технологий для разработки интернет-магазина. Принципы его работы и оценка эффективности. Разработка динамических web-страниц, управляемых базой данных. Исследование потоков данных. Модели жизненного цикла программного обеспечения.
дипломная работа, добавлен 27.02.2013Изучение принципов использования нетекстовых элементов гипертекста: изображений, таблиц, списков и форм. Введение стандарта HTML 4.0 и его преимущества. Использование атрибута method для указания HTTP-метода передачи данных. Скриншоты интернет страниц.
лабораторная работа, добавлен 25.05.2016- 48. Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
Система визуального эвристического кластерного анализа Visual HCA. Описание работы алгоритмов классификации текстов и отбора слов в словари. Автоматизированная переработка текстов в современной библиотеке как перспективное направление развития ИРБИС.
диссертация, добавлен 28.12.2013 Математические и алгоритмические основы решения задачи. Формула Тейлора для некоторых элементарных функций. Функциональные модели решения задачи и их программная реализация. Понятие элементарной функции. Пример выполнения программы для вычисления.
курсовая работа, добавлен 20.01.2010Описание программной оболочки, алгоритмов и процедур для распознавания ограниченной группы слов на основе скрытых моделей Маркова. Особенности распознавания в режиме реального времени, использование функции распределения вероятностей наблюдаемых событий.
статья, добавлен 28.11.2016