Автоматическое распознавание именованных сущностей в текстах на русском языке

Статистические методы извлечения сущностей, их классификация и отличительные особенности. Именованные сущности как объект лингвистического исследования. Описание работы алгоритма для векторизации слов с учетом морфологических и синтаксических признаков.

Подобные документы

  • Обзор подходов к решению задачи извлечения именованных сущностей по фармакологической и химической тематике. Описание архитектуры системы, ее составных частей, этапов подготовки программного обеспечения, выбор модулей и признаков для машинного обучения.

    диссертация, добавлен 26.08.2016

  • Существующие методы извлечения информации из текстовых данных. Способы извлечения сущностей и отношений. Описание методов автоматического построения онтологий по корпусу, а также способов их оценки. Идентификация фактов, локализованных во времени.

    статья, добавлен 26.04.2019

  • Обоснование выбора технологии и программных средств. Процесс инициализации проекта и определение множества сущностей. Матрица связей, их описание. Диаграмма уровня сущностей и ключей. Описание клиентского приложения, обобщенная схема работы системы.

    курсовая работа, добавлен 15.02.2018

  • Критерии качества даталогических моделей. Алгоритм получения наилучшего набора типов сущностей. Виды формальных типов структур, которые могут быть использованы в схеме организации данных. Метод преобразования типов сущностей в объекты модели данных.

    статья, добавлен 01.09.2018

  • Сетевая архитектура и компоненты Windows. Именованные каналы и почтовые ящики. Функционирование и особенности реализации именованных каналов и почтового ящика. Модель OSI и сетевые компоненты Windows. Интерфейс именованных каналов и почтовых ящиков.

    контрольная работа, добавлен 11.12.2012

  • Анализ предметной области и разработка контекстной диаграммы. Технология проектирования баз данных, определение сущностей и взаимосвязей между ними. Принципы разработки модели. Задание первичных и альтернативных ключей, определение атрибутов сущностей.

    курсовая работа, добавлен 27.11.2014

  • Описание комплексного метода снятия частеречной омонимиии в тексте на русском языке. Сравнительная оценка эффективности классического N-граммного подхода и собранной статистики совместной сочетаемости слов для задачи POS-tagging при комплексном подходе.

    статья, добавлен 18.01.2018

  • Определение типов сущностей, связей и доменов атрибутов. Определение первичных и альтернативных ключей для сущностей. Создание концептуальной модели базы данных – диаграммы "сущность-связь". Бизнес-правила предприятия и анализ выполнения транзакций.

    курсовая работа, добавлен 19.06.2015

  • Разработка метода формального представления базовых сущностей парадигмы предельных обобщений: тестов, орграфов и системопаттернов. Правила пересчета между доменами разного уровня общности, с использованием математического аппарата алгебры предикатов.

    автореферат, добавлен 30.01.2016

  • Текст – вербализированное представление модели мира автора. Наличие некоторой системы понятий, соответственно предметной области. Этапы восприятия. Интерпретация содержания синтаксических конструкций. Результат понимания. Автоматическое распознавание.

    презентация, добавлен 09.09.2017

  • Начальное формирование данных обо всех словах в виде списка. Поиск заданного слова в словаре и печать его толкования. Поиск синонимов – слов с одинаковыми значениями на русском языке и подсчет их количества. Описание классов и их программная реализация.

    курсовая работа, добавлен 16.12.2012

  • Проектирование с помощью "Rational Rose" систем любой сложности: от банковской системы до разработки кода на С++. Возможности программного инструмента. Типы сущностей в объектно-ориентированном языке моделирования UML. Преимущества "Rational Rose".

    реферат, добавлен 29.12.2014

  • Система, разработанная для автоматического поиска и выделения в тексте на русском языке конструкций по их описанию в виде лексико-синтаксических шаблонов языка LSPL. Применение системы для решения различных прикладных задач, требующих анализа ЕЯ-текстов.

    статья, добавлен 19.01.2018

  • Представлено действие алгоритма, который показывает хорошие результаты на сложных многокомпонентных логотипах, которые могут иметь сложные градиенты. Преимуществом данного алгоритма является линейное по количеству точек изображения время работы.

    статья, добавлен 19.01.2018

  • Стандарт шифрования данных DES для защиты от несанкционированного доступа к информации в государственных и коммерческих организациях США. Особенности реализации алгоритма шифрования DES на языке Delphi. Разработка интерфейса программы и алгоритма работы.

    курсовая работа, добавлен 16.09.2017

  • Обоснование потребности в разработке новых эффективных методов быстрого извлечения и индексирования текстовой информации из видеопотоков. Разработка алгоритма, способного выполнять быструю локализацию и распознавание графического текста на видео.

    статья, добавлен 30.07.2020

  • Методы извлечения оценочных слов и проставления оценок отзывам. Разработка подхода к оценке отзывов об объекте, основанного на применении оценочных слов из конкретной предметной области. Рассмотрение метода классификации отзывов о фильмах на три класса.

    статья, добавлен 18.01.2018

  • Анализ работы учебного офиса с регламентирующими документами. Моделирование бизнес-процессов TO-BE. Формулировка требований к информационной системе. Описание сущностей и связей между ними. Проектирование базы данных и пользовательского интерфейса.

    дипломная работа, добавлен 21.09.2018

  • Распознавание символов по скелетному изображению, использование нейронной сети. Вычисление набора признаков скелета символа, его идентификации по результатам обучения нейронной сети. Устойчивость алгоритма к искажениям символов и параметрам шрифта.

    статья, добавлен 25.09.2012

  • Описание предметной области, которая будет реализована в базе данных. Определение процедур, сущностей и атрибутов базы. Структура базы данных. Типы данных атрибутов таблиц базы. Построение запросов на языке SQL. Разработка форм и отчетов базы данных.

    лабораторная работа, добавлен 31.03.2017

  • Отличительные черты и особенности семейства высокоуровневых языков программирования – Бейсик. Построение и описание блок-схемы алгоритма решения задачи. Распечатка программы на языке Бейсик, распечатка исходных данных. Распечатка результатов расчета.

    курсовая работа, добавлен 02.07.2010

  • Функциональный способ определения "данных пересечения" и взаимозаменяемость "слабых сущностей" и документов в моделях данных. Базовые классы структур и правила структуризации данных, содержащихся в документах. Особенности даталогического моделирования.

    статья, добавлен 01.09.2018

  • Разработка базы данных (БД) "Сельскохозяйственные работы", определение ее предметной области. Основные предметно-значимые сущности БД (предприятие, продукция и поставки). Ключевые предметно-значимые атрибуты сущностей. Модель "сущность – связь" для БД.

    контрольная работа, добавлен 11.03.2018

  • Описание тестового набора MediaBench II, характеристика автоматической векторизации Intel C/C++. Наборы векторных инструкций, особенности компилятора LLVM/Clang. Алгоритм кодирования MPEG2 и сжатия JPEG. Утилита GNU Make, профилировщик GNU gprof.

    курсовая работа, добавлен 23.05.2018

  • Описание архитектуры системы, основные сущности и структуры данных. Представление основных сущностей каталога в базе данных. Фильтрация информации и интеграция с данными подписчика. Проведение реструктуризации данных. Архитектура каталога метаданных.

    курсовая работа, добавлен 28.10.2018

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.