Классификация медиа-текстов с использованием машинного обучения
Описание применения алгоритмов random forest ("случайный лес") и support vector machine (метод опорных векторов) для классификации текстов новостных изданий. Поиск оптимальных параметров для работы алгоритмов с помощью случайного поиска и поиска по сетке.
Подобные документы
Рассмотрение проблемы перевода каламбура. Выявление закономерностей выполнения различных типов переводческих операций при передаче каламбура. Разработка алгоритмов, имитирующие когнитивные процессы. Решение проблем совершенствования машинного перевода.
статья, добавлен 14.09.2020Психолингвистические особенности восприятия медиа-текстов и полисемичных заголовков их данных на основе речевых реакций реципиентов. Исследование текстовых проекций, репрезентирующих многообразие отношений в коммуникативной системе "человек-социум".
автореферат, добавлен 02.08.2018Анализ коммуникативно-прагматической и семантической структуры заголовков новостных сообщений информационных агентств. Определение места заголовка в общей коммуникативной структуре текста сообщения. Типичные семантические модели новостных заголовков.
статья, добавлен 16.12.2018Описание основных типов и особенностей машинного перевода текстов на другие языки. Характеристика популярных онлайн-переводчиков и словарей: Ace Translator, Pragma, QDictionаry, Lingvo OnLine, PROMT, ABBYY Lingvo. Изучение истории машинного перевода.
реферат, добавлен 03.12.2014- 30. Что это значит: исследование особенностей понимания текста с помощью семантизирующего эксперимента
Особенности применения семантизирующого эксперимента в современных лингвистических исследованиях. Проверка предположения о сложности толкования некоторых речевых единиц. Изучение специфики понимания текстов реципиентами на материале новостных анонсов.
статья, добавлен 05.03.2018 Место публицистического стиля в иерархии функциональных стилей. Лингвистические особенности текстов публицистического стиля английского и русского языка. Особенности перевода текстов публицистического стиля. Анализ практического материала (статьи).
практическая работа, добавлен 18.04.2011Анализ подхода к автоматическому построению списка словосочетаний по корпусу выровненных параллельных текстов (текстов и их переводов, сопоставленных по предложениям). Особенности получения словосочетаний для улучшения работы синтаксического анализатора.
статья, добавлен 18.01.2018Ключевые характеристики частотного и рангового анализа. Исследование применимости авторского инварианта к анализу поэзии. Алгоритм поиска авторского инварианта. Частотный анализ русских поэтических текстов. Характеристики, подозрительные на инвариант.
дипломная работа, добавлен 12.06.2016Рассмотрение текстов глобальных масс-медиа, представленных в сети Интернет. Влияние дискурса на социальные, политические процессы в мире, связи медиа и института общественного мнения. Методы исследования, применяемые в социологии массовой коммуникации.
статья, добавлен 27.12.2017- 35. Основные принципы группировки иероглифов и системы поиска в современных словарях китайского языка
Определение понятия и основные группировки китайских иероглифов. Разработка новой системы их поиска в современных словарях. Виды словарей и система поиска иероглифов в современных словарях. Описание графических систем поиска: ключевой, фонетической.
статья, добавлен 20.01.2018 Описание критериев для обоснования отбора источников, максимально отражающих совокупность текстов для выделения и инвентаризации английских терминов в области информационных технологий. Аутентичность, многонациональность, информативность текстов.
статья, добавлен 02.05.2022Значение различения омографов в научной речи для классификации частей речи при составлении корпусов текстов и автоматических баз терминов. Анализ основных понятий, свойств и задач корпусной лингвистики и этапов создания электронного корпуса текстов.
статья, добавлен 10.01.2019Определение и общая классификация рекламных текстов, выявление их характерных стилистических особенностей. Исследование наиболее частых трудностей, возникающих при переводе рекламных текстов. Подбор примеров из публицистической продукции и сети Интернет.
курсовая работа, добавлен 23.04.2014Определение роли и обоснование необходимости изучения и классификации текстов, обслуживающих сферы медицины и фармации. Комплексное рассмотрение лекарственных инструкций как пограничных текстов, относящихся одновременно к сфере медицины и фармации.
статья, добавлен 01.11.2018- 40. Метадискурсивные средства для организации академического дискурса на примере текстов дипломных работ
Функционирование элементов метадискурса в письменном академическом дискурсе. Выпускные квалификационные работы бакалавров. Рассмотрение классификации метадискурсивных средств. Примеры из текстов выпускных квалификационных работ студентов-бакалавров.
статья, добавлен 29.04.2019 Возможность использования разработанной Институтом прикладной и математической лингвистики МГЛУ методики глубинного аннотирования поликодовых текстов в качестве лингводидактического инструмента. Особое внимание уделяется аннотированию текстов в Интернете.
статья, добавлен 29.05.2022Переводческие трансформации и особенности их применения на грамматическом, лексическом, стилистическом и синтаксическом уровнях, при переводе туристских текстов. Специфика переводов текстов туристской тематики. Перевод двуязычного путеводителя.
статья, добавлен 25.06.2021Исследование основных проблем машинного перевода. Особенности включения достижений цифровых технологий в работу современного переводчика художественных текстов. Использование их в обучении переводу, при передаче авторского стиля, стилистики произведения.
статья, добавлен 22.10.2023Суть смысловой неопределенности текстов правового и медийного дискурсов с помощью онлайн-программ. Анализ конфликтогенных факторов, вызванных семантической неопределенностью в проблемах машинного перевода медиатекстов с учетом лексической полисемии.
статья, добавлен 08.09.2024Характерные особенности рекламных текстов и их классификация. Стилистические особенности рекламных текстов: создание образности и употребление глагола, личных и притяжательных местоимений, приемы параллелизма и повтора, номинативные предложения.
курсовая работа, добавлен 18.04.2012Комплексный анализ текстов районных СМИ о пожилом человеке. Исследование лексических, прагматических, стилевых и смысловых особенностей текстов, репрезентирующих определенные смысловые компоненты разных концептуальных областей, связанных с жизнью.
статья, добавлен 25.08.2020Рассмотрение основных особенностей перевода английских технических текстов на русский. Изучение и характеристика способов достижения эквивалентности и адекватности при переводе. Исследование отличительной черты текстов технической направленности.
статья, добавлен 22.01.2016Анализ особенностей композиционного строения текстов сертификатов. Отличительные особенности текстов сертификатов соответствия. Организация, семантический потенциал, условия функционирования и принципы формирования структуры текстов сертификатов.
дипломная работа, добавлен 09.06.2014Исследование предельно малых текстов, представленных в формате "пустой книги". Обзор "пустых книг" в рамках классификации предельно малых текстов, предложенной А. Кондратовым (в соответствии с которой они бывают двух видов: "нулевые" и "пустотные").
статья, добавлен 26.01.2019Исследование лексико-семантической группы глаголов речевого сообщения, используемых в новостных текстах СМИ. Рассмотрено функционирование глаголов речи "заявить - заявлять", "сообщить". Генеральная выборка глаголов речи из 1000 новостных текстов.
статья, добавлен 10.03.2021