Вклад семантической информации в распознавание кореферентных отношений
Референция в теоретической и прикладной лингвистике. Алгоритмы разрешения анафоры и кореферентности. Предварительная обработка собранных текстов. Сбор, разметка и предварительная обработка текстового корпуса. Способы извлечения информации из Википедии.
Подобные документы
Описание проекта OntosMiner. Анализ инструментальных средств для создания систем извлечения информации из текстов на различных естественных языках, разработанных в рамках проекта. Характеристика семейства соответствующих лингвистических процессоров.
статья, добавлен 19.01.2018Изучение подхода к автоматизированному пополнению онтологической базы знаний "О Мире" при помощи синтактико-семантического анализа путем "начитывания" естественно-языковых текстов для качественного повышения уровня автоматизированного разрешения анафоры.
статья, добавлен 17.01.2018Рассмотрение проблем сохранения в переводе смысловой и структурной связности нехудожественного текста, реализуемой посредством кореферентных единиц. Способы сохранения связности нехудожественных текстов в переводах с английского языка на русский.
статья, добавлен 30.03.2019Снятие морфологической неоднозначности как ключевой вопрос автоматического создания морфологической разметки текстов. Системы анализа русского языка. Размер корпуса, необходимого и достаточного для получения относительно высокой точности разметки.
статья, добавлен 15.01.2019Разработка модели агглютинативной морфологии, основанной на теории графов. Теория графов, или метод сетей, как современный подход в теоретической и прикладной лингвистике. Реализация модели для современного башкирского языка и для старотюркского.
статья, добавлен 08.05.2018Методика сбора текстового материала. Общение с различными группами носителей говора. Сбор сведений культурологического, исторического и этнографического характера о городе Лисаковск Костанайской области. Расшифровки аудиозаписей диалектных текстов.
отчет по практике, добавлен 31.05.2016Определение границ применимости онлайн-инструментов автоматической обработки цифровых текстов (поисковых машин, языковых корпусов, Google Books) в лингвостатистических исследованиях на примере анализа частотности употребления культурно значимых онимов.
статья, добавлен 08.01.2021Анализ роли языковых знаков как носителей информации в современной лингвистике. Особенности языка как системы знаков и символов, их основные функции и свойства, семантическая характеристика и структура: фонемы, слоги, морфемы, слова и предложения.
реферат, добавлен 24.11.2014Слово как элемент лексико-семантической системы языка, отражающий определенный фрагмент действительности, социального опыта, обусловленного деятельностью этноса. Отражение и хранение культурологической информации задача единиц лексического уровня.
статья, добавлен 09.12.2018Способ изучения рифмы с помощью метода сетей. Описание построения графовой базы данных рифм, начиная с извлечения рифм из поэтического корпуса Национального русского языка и заканчивая хранением и поиском полученной информации. Методы визуализации сетей.
дипломная работа, добавлен 30.08.2016Проведение исследования основных современных направлений изучения языка масс-медиа. Анализ рассмотрения текстов средств массовой информации как медиадискурса, включающего в себя различные формы функционирования языка в печатной и электронной прессе.
статья, добавлен 21.10.2021Понятия корпусной лингвистики, методы создания корпуса. Описание проекта "Весь Толстой в один клик". Описание языка программирования Hypertext Preprocessor, взаимодействие с HyperText Markup Language. Раздел электронного корпуса текстов Русский Паскаль.
дипломная работа, добавлен 21.09.2016Сбор текстов и состав корпусов, объёмы и состав "основных корпусов". Распределение текстов корпусов соцсетей по годам, в тысячах словоупотреблений. Рассмотрение электронных корпусов, недавно разработанных наиболее крупных финно-угорских языков России.
статья, добавлен 07.04.2022Проблема определения метафоры, способы перевода. Признак семантической двуплановости, отвлеченности, экспрессивности. Функции в научно-популярном стиле, способы перевода в газетной публицистике. Прямой перевод, синтаксическое добавление и опущение.
курсовая работа, добавлен 13.05.2020Ускорение и облегчение статистических исследований в языкознании и литературоведении. Обработка различных массивов текстовой информации посредством разбиения ее на лингвистические единицы, для создания словарных баз данных, построения частотных словарей.
статья, добавлен 04.12.2018Анализ взаимосвязи предлогов и предложных конструкций в различных трактовках. Определение правил семантической интерпретации: разметка совокупности контекстов, выявление частот распределения и установление специфики предложно-падежных групп при глаголе.
курсовая работа, добавлен 14.11.2009Дискурс - пространственно-временной и информационный континуум, который сосредотачивается вокруг текста в процессе его создания или воспроизведения по определенным принципам лингвосемиотической системы. Основные способы сокрытия текстовой информации.
статья, добавлен 20.05.2017Соединение наработок ученых и данных, полученных при исследовании текстового корпуса, созданного на основе художественных произведений английских и американских авторов. Выделение словоупотреблений, которые соответствуют понятию "абсолютная" единица.
статья, добавлен 15.03.2023Способы фиксации и сохранения информации при углубленном чтении. Конспектирование, принципы и методы составления конспекта, схематический план. Составление аннотации, её структура. Монографический и обзорный рефераты, их основные части и общие требования.
реферат, добавлен 25.01.2016- 45. Невербальные компоненты текстовой информации (на материале английской художественной литературы)
Роль невербальных компонентов в процессах интерпретации текстовой информации. Способы проявления индивидуально-авторской дискурсивности и экспрессивности на уровне пунктуационной системы языка. Взаимное влияние вербальных компонентов текстовой информации.
автореферат, добавлен 01.04.2018 Исследование средств воздействия и способов формирования в семантической структуре астионима Одесса зон прагматически существенной информации и основных закономерностей прагматического использования топонима в русскоязычных средствах массовой информации.
статья, добавлен 24.09.2017Устройство и особенности поэтического корпуса Национального корпуса русского языка, его параметры (стиховедческие). Возможности русского поэтического корпуса, их использование в преподавании теории литературы, истории русской литературы, текстологии.
статья, добавлен 05.03.2019Лингвистические особенности рекламных текстов на русском языке. Место русскоязычных рекламных текстов в средствах массовой информации Азербайджана. Структура рекламных текстов, механизм воздействия на слушателя, языковая норма и проблемы восприятия.
статья, добавлен 18.02.2021- 49. Гендерный аспект выражения несогласия в устном академическом дискурсе (на материале корпуса MICASE)
Анализ специфики выражения несогласия с точки зрения гендерного аспекта на примере текстов Мичиганского корпуса академического разговорного английского языка. Способы эксплицирования несогласия. Языковые средства смягчения категоричности высказывания.
статья, добавлен 20.01.2019 Варианты актуализации авторами художественных текстов речевой стратегии оптимизации понимания сообщаемого. Виды сигналов избыточной информации. Способы оптимизации понимания, которые могут выбираться отправителем как осознанно, так и автоматически.
статья, добавлен 08.01.2019