Исследование и разработка методов извлечения именованных сущностей
Разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском языке на основе анализа существующих методов и инструментов извлечения именованных сущностей. Особенности предметной области – текстов микроблогов.
Подобные документы
Статистические методы извлечения сущностей, их классификация и отличительные особенности. Именованные сущности как объект лингвистического исследования. Описание работы алгоритма для векторизации слов с учетом морфологических и синтаксических признаков.
дипломная работа, добавлен 10.12.2019Существующие методы извлечения информации из текстовых данных. Способы извлечения сущностей и отношений. Описание методов автоматического построения онтологий по корпусу, а также способов их оценки. Идентификация фактов, локализованных во времени.
статья, добавлен 26.04.2019Анализ древнетибетских текстов. Использование аппарата статистического анализа множества исходных текстов на древнетибетском языке, записанных в кодировке UTF-8. Использование технологий анализа больших объемов данных для извлечения смысла (семантики).
статья, добавлен 15.01.2019Сетевая архитектура и компоненты Windows. Именованные каналы и почтовые ящики. Функционирование и особенности реализации именованных каналов и почтового ящика. Модель OSI и сетевые компоненты Windows. Интерфейс именованных каналов и почтовых ящиков.
контрольная работа, добавлен 11.12.2012Особенности функционирования систем извлечения информации из текстов на естественном языке. Метрики проекта TIPSTER и программы TIDES, их достоинства и недостатки. Использование метрик для оценки качества функционирования систем семейства OntosMiner.
статья, добавлен 17.01.2018Анализ предметной области и разработка контекстной диаграммы. Технология проектирования баз данных, определение сущностей и взаимосвязей между ними. Принципы разработки модели. Задание первичных и альтернативных ключей, определение атрибутов сущностей.
курсовая работа, добавлен 27.11.2014Применение корпусной лингвистики в области преподавания иностранного языка. Методология создания и разметки корпуса текстов. Проектирование упражнения для изучения политических терминов. Разработка программы для автоматизированного извлечения текстов.
дипломная работа, добавлен 07.10.2016Обоснование выбора технологии и программных средств. Процесс инициализации проекта и определение множества сущностей. Матрица связей, их описание. Диаграмма уровня сущностей и ключей. Описание клиентского приложения, обобщенная схема работы системы.
курсовая работа, добавлен 15.02.2018Построение базы данных предметной области "Расписание экзаменов". Информация и разработка ER-модели. Атрибуты сущностей и связи. Получение концептуальной ER-диаграммы. Хранение информации о студентах, предметах, экзаменах. Требования к отчету работы.
лабораторная работа, добавлен 16.03.2014Критерии качества даталогических моделей. Алгоритм получения наилучшего набора типов сущностей. Виды формальных типов структур, которые могут быть использованы в схеме организации данных. Метод преобразования типов сущностей в объекты модели данных.
статья, добавлен 01.09.2018Описание исходных данных, ключевых сущностей и процессов, протекающих в предметной области. Действующие лица предметной области и взаимосвязи. Проектирование структуры базы данных предметной области. Проектирование экспертной системы предметной области.
курсовая работа, добавлен 11.03.2014Обоснование потребности в разработке новых эффективных методов быстрого извлечения и индексирования текстовой информации из видеопотоков. Разработка алгоритма, способного выполнять быструю локализацию и распознавание графического текста на видео.
статья, добавлен 30.07.2020Характеристика структуры комплекса инструментов автоматизированного анализа текстов. Описание механизмов лингвистической, статистической, аналитической обработки текстов, а также графематического, орфологического и синтаксического сервисов анализа текста.
статья, добавлен 28.11.2016Рассмотрение методов и средств извлечения знаний с учетом оценки качества моделей в системах поддержки принятия решений. Возможности совместного эффективного использования экспертных систем, интеллектуального анализа данных, машинного логического вывода.
статья, добавлен 17.05.2020- 15. Разработка системы анализа стилистики синтаксических конструкций научных текстов на английском языке
Задача автоматизированного анализа стиля англоязычных текстов. Описание алгоритмов и библиотек для автоматизированного анализа текстов на английском языке. Реализация системы для анализа синтаксического стиля научных текстов на английском языке.
дипломная работа, добавлен 27.08.2018 - 16. Представление базовых сущностей парадигмы предельных обобщений с помощью алгебропредикатных структур
Разработка метода формального представления базовых сущностей парадигмы предельных обобщений: тестов, орграфов и системопаттернов. Правила пересчета между доменами разного уровня общности, с использованием математического аппарата алгебры предикатов.
автореферат, добавлен 30.01.2016 Анализ предметной области и выявление необходимого набора сущностей. Построение набора отношений базы данных, таблиц и атрибутов. Разработка и построение интерфейса главной и рабочей форм. Выполнение программного кода в среде Microsoft Visual C#.
курсовая работа, добавлен 15.11.2012Определение и приемы анализа текстов с целью нахождения и извлечения мнений и отношений автора к процессу, событию или объекту из текста в естественном языке. Исследование тональности и выделение маркеров отношения в текстах, посвященных сети Интернет.
реферат, добавлен 30.06.2017Разработка информационной системы с ведением системного каталога, содержащего перечень существующих магазинов и характеристики моделей телефонов. Разработка инфологической модели и выделение основных сущностей. Реляционная база данных с помощью Interbase.
курсовая работа, добавлен 12.01.2009Характеристика специфических особенностей осуществления складского учета в гипермаркете. Выделение сущностей, их атрибутов и первичных ключей - одна из задач проектирования информационной модели предметной области. Реляционная модель базы данных.
дипломная работа, добавлен 09.06.2017Анализ предметной области. Выбор редактора диаграмм и блок-схем для Windows. Система управления базами данных - как посредник между пользователем и БД. Процесс построения информационной модели. Подробная структура основных сущностей. Листинг программы.
реферат, добавлен 23.04.2019Разработка информационной системы реализующей профессиональный стандарт «Программист» и состоящей из базы данных и приложения, управляющего ей. Определение достаточного количества сущностей для составления цельной картины заданной предметной области.
курсовая работа, добавлен 18.04.2019Лингвистические особенности организации ФИС (формулы изобретения на способ). Возможности переиспользования интерфейса системы автоматического синтеза формулы изобретения для определения запроса к системе автоматического поиска патентных текстов.
автореферат, добавлен 30.04.2018Описание существующих бизнес-процессов, в котором используются естественный и графический языки как основное назначение функциональной модели. IDEF1X – одна из методик разработки реляционных баз данных. Методы определения атрибутов сущностей модели.
курсовая работа, добавлен 17.06.2017Процесс разработки программы автоматизированного извлечения табличных данных из документов формата PDF в документы формата Excel. Описание библиотек для создания рабочей версии программного продукта. Разработка пользовательского интерфейса программы.
дипломная работа, добавлен 04.12.2019