Автоматическое распознавание именованных сущностей в текстах на русском языке
Статистические методы извлечения сущностей, их классификация и отличительные особенности. Именованные сущности как объект лингвистического исследования. Описание работы алгоритма для векторизации слов с учетом морфологических и синтаксических признаков.
Подобные документы
Обзор подходов к решению задачи извлечения именованных сущностей по фармакологической и химической тематике. Описание архитектуры системы, ее составных частей, этапов подготовки программного обеспечения, выбор модулей и признаков для машинного обучения.
диссертация, добавлен 26.08.2016Существующие методы извлечения информации из текстовых данных. Способы извлечения сущностей и отношений. Описание методов автоматического построения онтологий по корпусу, а также способов их оценки. Идентификация фактов, локализованных во времени.
статья, добавлен 26.04.2019Обоснование выбора технологии и программных средств. Процесс инициализации проекта и определение множества сущностей. Матрица связей, их описание. Диаграмма уровня сущностей и ключей. Описание клиентского приложения, обобщенная схема работы системы.
курсовая работа, добавлен 15.02.2018Критерии качества даталогических моделей. Алгоритм получения наилучшего набора типов сущностей. Виды формальных типов структур, которые могут быть использованы в схеме организации данных. Метод преобразования типов сущностей в объекты модели данных.
статья, добавлен 01.09.2018Сетевая архитектура и компоненты Windows. Именованные каналы и почтовые ящики. Функционирование и особенности реализации именованных каналов и почтового ящика. Модель OSI и сетевые компоненты Windows. Интерфейс именованных каналов и почтовых ящиков.
контрольная работа, добавлен 11.12.2012Анализ предметной области и разработка контекстной диаграммы. Технология проектирования баз данных, определение сущностей и взаимосвязей между ними. Принципы разработки модели. Задание первичных и альтернативных ключей, определение атрибутов сущностей.
курсовая работа, добавлен 27.11.2014Описание комплексного метода снятия частеречной омонимиии в тексте на русском языке. Сравнительная оценка эффективности классического N-граммного подхода и собранной статистики совместной сочетаемости слов для задачи POS-tagging при комплексном подходе.
статья, добавлен 18.01.2018Определение типов сущностей, связей и доменов атрибутов. Определение первичных и альтернативных ключей для сущностей. Создание концептуальной модели базы данных – диаграммы "сущность-связь". Бизнес-правила предприятия и анализ выполнения транзакций.
курсовая работа, добавлен 19.06.2015- 9. Представление базовых сущностей парадигмы предельных обобщений с помощью алгебропредикатных структур
Разработка метода формального представления базовых сущностей парадигмы предельных обобщений: тестов, орграфов и системопаттернов. Правила пересчета между доменами разного уровня общности, с использованием математического аппарата алгебры предикатов.
автореферат, добавлен 30.01.2016 Текст – вербализированное представление модели мира автора. Наличие некоторой системы понятий, соответственно предметной области. Этапы восприятия. Интерпретация содержания синтаксических конструкций. Результат понимания. Автоматическое распознавание.
презентация, добавлен 09.09.2017Начальное формирование данных обо всех словах в виде списка. Поиск заданного слова в словаре и печать его толкования. Поиск синонимов – слов с одинаковыми значениями на русском языке и подсчет их количества. Описание классов и их программная реализация.
курсовая работа, добавлен 16.12.2012Проектирование с помощью "Rational Rose" систем любой сложности: от банковской системы до разработки кода на С++. Возможности программного инструмента. Типы сущностей в объектно-ориентированном языке моделирования UML. Преимущества "Rational Rose".
реферат, добавлен 29.12.2014Система, разработанная для автоматического поиска и выделения в тексте на русском языке конструкций по их описанию в виде лексико-синтаксических шаблонов языка LSPL. Применение системы для решения различных прикладных задач, требующих анализа ЕЯ-текстов.
статья, добавлен 19.01.2018Представлено действие алгоритма, который показывает хорошие результаты на сложных многокомпонентных логотипах, которые могут иметь сложные градиенты. Преимуществом данного алгоритма является линейное по количеству точек изображения время работы.
статья, добавлен 19.01.2018Стандарт шифрования данных DES для защиты от несанкционированного доступа к информации в государственных и коммерческих организациях США. Особенности реализации алгоритма шифрования DES на языке Delphi. Разработка интерфейса программы и алгоритма работы.
курсовая работа, добавлен 16.09.2017Обоснование потребности в разработке новых эффективных методов быстрого извлечения и индексирования текстовой информации из видеопотоков. Разработка алгоритма, способного выполнять быструю локализацию и распознавание графического текста на видео.
статья, добавлен 30.07.2020Методы извлечения оценочных слов и проставления оценок отзывам. Разработка подхода к оценке отзывов об объекте, основанного на применении оценочных слов из конкретной предметной области. Рассмотрение метода классификации отзывов о фильмах на три класса.
статья, добавлен 18.01.2018Анализ работы учебного офиса с регламентирующими документами. Моделирование бизнес-процессов TO-BE. Формулировка требований к информационной системе. Описание сущностей и связей между ними. Проектирование базы данных и пользовательского интерфейса.
дипломная работа, добавлен 21.09.2018Распознавание символов по скелетному изображению, использование нейронной сети. Вычисление набора признаков скелета символа, его идентификации по результатам обучения нейронной сети. Устойчивость алгоритма к искажениям символов и параметрам шрифта.
статья, добавлен 25.09.2012Описание предметной области, которая будет реализована в базе данных. Определение процедур, сущностей и атрибутов базы. Структура базы данных. Типы данных атрибутов таблиц базы. Построение запросов на языке SQL. Разработка форм и отчетов базы данных.
лабораторная работа, добавлен 31.03.2017Отличительные черты и особенности семейства высокоуровневых языков программирования – Бейсик. Построение и описание блок-схемы алгоритма решения задачи. Распечатка программы на языке Бейсик, распечатка исходных данных. Распечатка результатов расчета.
курсовая работа, добавлен 02.07.2010Функциональный способ определения "данных пересечения" и взаимозаменяемость "слабых сущностей" и документов в моделях данных. Базовые классы структур и правила структуризации данных, содержащихся в документах. Особенности даталогического моделирования.
статья, добавлен 01.09.2018Разработка базы данных (БД) "Сельскохозяйственные работы", определение ее предметной области. Основные предметно-значимые сущности БД (предприятие, продукция и поставки). Ключевые предметно-значимые атрибуты сущностей. Модель "сущность – связь" для БД.
контрольная работа, добавлен 11.03.2018Описание тестового набора MediaBench II, характеристика автоматической векторизации Intel C/C++. Наборы векторных инструкций, особенности компилятора LLVM/Clang. Алгоритм кодирования MPEG2 и сжатия JPEG. Утилита GNU Make, профилировщик GNU gprof.
курсовая работа, добавлен 23.05.2018Описание архитектуры системы, основные сущности и структуры данных. Представление основных сущностей каталога в базе данных. Фильтрация информации и интеграция с данными подписчика. Проведение реструктуризации данных. Архитектура каталога метаданных.
курсовая работа, добавлен 28.10.2018