Повышение релевантности мета-поиска с использованием деревьев синтаксического разбора
Описание подходов к упорядочению текстов выдачи поисковой системы по близости к запросу с использованием модели машинного обучения, основанной на сравнении деревьев синтаксического разбора. Результаты использования выборки запросов на английском языке.
Подобные документы
- 1. Разработка системы анализа стилистики синтаксических конструкций научных текстов на английском языке
Задача автоматизированного анализа стиля англоязычных текстов. Описание алгоритмов и библиотек для автоматизированного анализа текстов на английском языке. Реализация системы для анализа синтаксического стиля научных текстов на английском языке.
дипломная работа, добавлен 27.08.2018 Метрики оценки качества ранжирования, основные подходы к обучению. Оптимальная остановка бустинга. Выпуклая комбинация ранжирующих моделей. Автоматическое упорядочивание поисковой выдачи по релевантности заданному запросу. Конкретные признаки запросов.
диссертация, добавлен 26.08.2016Бинарная классификация тональности русскоязычных текстов, основные подходы к ее анализу и извлечению синтаксических зависимостей в предложениях. Разработка Python-библиотека для бинарной классификации эмоциональной окраски русскоязычных текстов.
дипломная работа, добавлен 30.08.2016Типология методов поиска. Виды соединения с сетью Интернет. Технологии поиска с использованием тематических каталогов. Поиск информации с использованием ключевых слов. Владение пользовательскими инструментами и техникой. Язык запросов поисковой системы.
курсовая работа, добавлен 29.02.2016Разработка методики оценки действий оператора эргатической системы "Летчик–Самолет" на этапе посадки. Описание методов машинного обучения с учителем: метода опорных векторов и градиентного бустинга деревьев. Тестирование алгоритмов машинного обучения.
статья, добавлен 28.11.2016Деревья GH, GNAT и mm-GNAT как метрические структуры данных, использующие обобщённое гиперплоскостное разбиение. Выполнение поиска ближайшего соседа. Реализация программы для сравнения деревьев GH, GNAT и mm-GNAT. Эффективность поисковых запросов.
статья, добавлен 27.05.2018Проблема невозможности дачи оценки времени выполнения операции поиска данных в информационной системе при использовании классических бинарных деревьев поиска. Способ решения данной проблемы путем использования АВЛ-деревьев: его преимущества и недостатки.
статья, добавлен 30.07.2017Характеристика и сущность LL(k)-грамматик. Основные особенности предсказывающих алгоритмов разбора. Проведение анализа разбора для LL(1)- грамматик и LL(k)- грамматик. Основные принципы k- предсказывающего алгоритма разбора. Сущность понятия FIRST(x).
реферат, добавлен 24.10.2011Описание реализованного автомата разбора. Анализ особенностей использования Graphviz – программного обеспечения визуализации графа, позволяющего представлять различную информацию как диаграммы абстрактных графов и сетей. Программная реализация автомата.
курсовая работа, добавлен 19.01.2020Построение модели машинного обучения для обработки входящих запросов в службу технической поддержки. Решение задачи классификации запросов в службу технической поддержки при помощи оригинального алгоритма, учитывающего специфику предметной области.
статья, добавлен 25.04.2022- 11. Система комплексного анализа русскоязычных текстовых сообщений на платформе IBM InfoSphere Streams
Анализ методов предварительной обработки текстовых сообщений, способов классификации и кластеризации. Программы определения тональности текста. Представление текста в виде дерева синтаксического разбора. Разработка системы анализа текстовой информации.
магистерская работа, добавлен 09.07.2016 Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016Разработка чат-бота для поиска текстов судебных решений. Рассмотрение механизма предварительной обработки текста запроса. Классификация запросов на естественном языке, перевод текста в векторное представление. Проектирование и тестирование нейронной сети.
статья, добавлен 24.02.2019Процесс поиска информации в Интернете, схема работы поисковой машины. Специфика работы поисковых программ, значение системы выдачи результатов поиска. Механизмы и алгоритмы поиска, законы Зипфа. Полнота и точность поиска, повышение пертинентности.
презентация, добавлен 10.03.2015Ускорение обработки огромных информационных массивов как одна из основных целей методики обнаружения вредоносного трафика с использованием анализа данных. Особенности настройки гиперпараметров алгоритма, который реализует метод машинного обучения.
статья, добавлен 18.01.2021Преобразование алгоритмов, основанных на использовании суффиксных деревьев. Построение графов связей между ключевыми словосочетаниями согласно анализируемому корпусу текстов. Разработка модифицированного программного продукта, реализующего алгоритмы.
дипломная работа, добавлен 07.07.2016Характеристика процесса конструирования модели синтаксического анализа. Описание предметной области. Регулярная грамматика для лексического анализа. КС-грамматика. Нисходящий синтаксический анализатор. Логическое проектирование. Проектирование интерфейса.
курсовая работа, добавлен 04.11.2018Характеристика дерева синтаксического анализа: определение, представление в DCG и Prolog, применение для извлечения смысла. Особенности использования синтаксических и семантических конструкций в системе обозначений DCG. Преобразование интерпретатором.
презентация, добавлен 17.10.2013Описание анализа систем распознавания эмоций с применением методов машинного обучения, находящихся в открытом доступе, в рамках курсового проекта по дисциплине Обучающие Технические Системы "Machine Learning". Neurobotics EmoDetect. Cognitive Emotion.
статья, добавлен 14.03.2019Создание модели автоматизированного биржевого агента, способной зарабатывать на совершении сделок по покупке и продаже финансовых инструментов на бирже. Генетические алгоритмы обучения для построения простых деревьев решений и объединения их в ансамбли.
дипломная работа, добавлен 26.08.2016Рассмотрение способа автоматического получения множества правил и их вероятностей из корпуса переводов в обучающем алгоритме для трансферной системы машинного перевода. Возможности получение правил трансфера. Линеаризация слов в целевом дереве разбора.
статья, добавлен 08.05.2018Анализ современных подходов к коррекции орфографии. Особенности модели машинного обучения. Использование префиксного дерева для поиска слов. Организация обновляемого словаря и реализация микросервиса. Разработка компонента коррекции для любых языков.
дипломная работа, добавлен 17.11.2015Описание алгоритма автоматического перевода текстов с одного языка на другой с использованием дерева модели мира. Перевод с помощью графа модели мира, активизация дерева на входном языке. Генерация осмысленных текстов с помощью дерева модели мира.
статья, добавлен 19.12.2021Решение задачи классификации переводов клиентов банка на легальные и мошеннические с использованием средств машинного обучения. Обнаружение мошеннических транзакций средствами машинного обучения. Решение задачи построения ансамбля классификаторов.
дипломная работа, добавлен 18.07.2020Характеристика Яндекса как наилучшей поисковой системой в российском Интернете. Правила формирования запросов в поисковой системе Яндекс. Характеристика простых правил формирования запроса в поисковой системе Яндекс. Анализ поиска по ключевым словам.
реферат, добавлен 05.10.2019