Автоматичне видобування колокацій з корпусу текстів
Визначення поняття "колокація" з точки зору підходів до його аналізу у сучасній корпусній лінгвістиці. Опис структури розробленого корпусу текстів, а також імплементації статистичної міри МІ для виявлення колокацій з інструкцій технічної документації.
Подобные документы
Характеристика підходів до розуміння понять фразеологізму та колокації в лінгвістичних студіях. Дослідження проблеми сполучуваності лексичних одиниць. Аналіз особливостей вивчення мовної палітри Р. Іваничука за допомогою фразеологізмів та колокацій.
статья, добавлен 27.10.2020Доведено доцільність використання корпусного інструментарію для формування реєстру лівобічних атрибутивних колокацій з лексемою effect (на базі підкорпусу наукових текстів Британського національного корпусу BNC), уточнено визначення поняття "корпус".
статья, добавлен 09.02.2023Проблема оцінювання репрезентативності корпусу текстів. Огляд поняття репрезентативності під різними кутами зору. Роль міждослідницької тріангуляції в забезпеченні репрезентативності корпусу текстів, недоліки застосовуваних тактик контролю її впливу.
статья, добавлен 29.11.2021Принципи укладання корпусних словників, зумовлені розвитком теорії корпусу текстів й концепції колокації в сучасній лінгвістиці. Необхідність застосування встановлених принципів для укладання корпусного словника колокацій українського юридичного дискурсу.
статья, добавлен 31.01.2018Аналіз основних лінгвістичних підходів і корпусного підходу до вивчення колокацій. Характеристика положення британського контекстуалізму. Розгляд сучасних українських досліджень колокацій, представлених лексико-граматичним і корпусним підходами.
статья, добавлен 06.04.2019Дослідження проблеми створення власного корпусу текстів на прикладі корпусу американських кіносценаріїв фільмів, призначених для сімейного перегляду. Опис методики та критеріїв конструювання лінгвістичних корпусів. Розгляд типології розробленого корпусу.
статья, добавлен 12.10.2018Проблема створення власного корпусу текстів на прикладі корпусу американських кіносценаріїв фільмів, призначених для сімейного перегляду. Методика та критерії конструювання лінгвістичних корпусів. Типологія та основні характеристики розробленого корпусу.
статья, добавлен 11.08.2020Виявлення перекладацьких універсалій експліцитації, симпліфікації, нормалізації на базі українського корпусу оригінальних художніх текстів та українського перекладного корпусу. "Третій код", яким є мова українського перекладного корпусу художніх текстів.
статья, добавлен 27.02.2021Аналіз особливостей морфологічної розмітки корпусів текстів української мови. Створення корпусу текстів технічної документації та реалізація методу автоматичної морфологічної розмітки, що дозволяє отримувати з нього приклади вживання словоформ і слів.
статья, добавлен 21.07.2018Дослідження проблеми створення корпусу текстів видатного лінгвісту, історика літератури Юрія Шевельова. Огляд основних структурних компонентів корпусу текстів, функцій, характеристик його наповнення, екстралінгвістичного й лінгвістичного розмічення.
статья, добавлен 04.09.2022Обґрунтування необхідності створення універсального електронного корпусу текстів як ефективного інструменту роботи перекладача. Переваги використання "корпусу паралельних текстів" при перекладі. Взаємодія корпусної лінгвістики та практики перекладу.
статья, добавлен 15.03.2018Виявлення проблемних завдань, які виникають під час розробки та створення корпусу текстів української термінології, способів їх вирішення та вагомості для проведення наукових досліджень. Лексикографічна та алгоритмічна форми побудови корпусу текстів.
статья, добавлен 11.07.2018Аналіз постійно відтворюваних одиниць - колокацій. Статистичний аналіз сполучуваності лексичних одиниць (ЛО), які дають змогу об’єктивно визначити якісні особливості ідіолекту письменника. Створення "швидкого корпусу" для підрахунку найбільш вживаних ЛО.
статья, добавлен 10.08.2022Розгляд лексичних одиниць і стереотипів побудови текстів з точки зору національно-культурної специфіки певної мовної спільності. Виявлення та опис культурно-мовних характеристик етнокультурної специфіки текстів. Аналіз кумулятивної функції мови.
статья, добавлен 10.09.2022- 15. Дослідження частотності біграм на матеріалі текстів Романа Іваничука, Василя Шкляра та Ліни Костенко
Дослідження ідіолекту письменника в мовознавчих студіях. Визначення корпусу текстів та його значення для проведення лінгвістичних досліджень. Виявлення особливостей функціональних стилів мови та стилю окремих авторів, для автоматичного опрацювання тексту.
статья, добавлен 02.11.2020 Розгляд особливостей тлумачення терміну "дискурс". Характеристика різних підходів до розуміння дискурсу в сучасній лінгвістиці. Залежність дискурсу не лише від змісту висловлювань і текстів, а й від методології, методики його реалізації і сфери впливу.
статья, добавлен 30.08.2016Дослідження публікації текстів у сучасній українській діалектології. Характеристика діалектних словників. Аналіз важливості корпусу текстів під час створення словника. Огляд особливостей запису, транскрипції та публікації діалектних текстів в словниках.
статья, добавлен 02.11.2018Аналіз проблем діалогового створення корпусу для вивчення текстів Підляшшя як джерел діалектологічних досліджень. Аналіз текстів різного характеру, визначення їх придатності до діалектологічного дослідження. Класифікаційні ознаки та вимоги до діалектних т
статья, добавлен 20.11.2018Класифікаційна парадигма текстових корпусів з огляду на те, яка його структура та дизайн. Приклади згаданих типів корпусів текстів. Дослідження та аналіз термінологічних еквівалентів назв корпусів за типом мовних даних в українській та англійській мовах.
статья, добавлен 20.01.2022Виявлення специфіки перекладу українською мовою текстів німецькомовних інструкцій до медичного обладнання. Встановлення мовних особливостей досліджуваних текстів з огляду на їхнє відтворення під час перекладу, аналіз типових ознак текстів інструкцій.
статья, добавлен 11.09.2020Аналіз англомовних текстів законодавчих актів Європейського Союзу, які включають регламенти, директиви та рішення. Виявлення особливостей функціонування лексичного складу текстів. Створення корпусу текстів LAEU – Legislative Acts of the European Union.
статья, добавлен 20.02.2023З’ясування семантико-когнітивних значень концептів дім і дорога в ідіолекті письменника на основі аналізу іменникових репрезентантів обох концептів. Аналіз методики створення концепції Корпусу текстів Валерія Шевчука як корпусу ілюстративного типу.
автореферат, добавлен 05.11.2013Характеристика актуальних математично-лінгвістичних методів дослідження в межах корпусного аналізу текстів. Особливість автоматично скомпільованого корпусу реалізації універсальних речень поступки в художніх текстах Британського національного корпусу.
статья, добавлен 22.01.2023Розгляд паралельного багатомовного національного корпусу російської мови (НКРМ), його структури, можливості збереження інформації, конотаційних особливостей. Застосування корпусу для багатомовного перекладу міжнародних офіційно-ділових документів.
статья, добавлен 27.03.2018Опис атрибутивних колокацій із лексемами "result" і "consequence", що вербалізують каузальну домінанту "ефект" на рівні з лексемою "effect", з позицій корпусного та зіставно-типологічного підходів. Високий ступінь перетинання семантичних значень лексем.
статья, добавлен 30.07.2020