Классификация медиа-текстов с использованием машинного обучения
Описание применения алгоритмов random forest ("случайный лес") и support vector machine (метод опорных векторов) для классификации текстов новостных изданий. Поиск оптимальных параметров для работы алгоритмов с помощью случайного поиска и поиска по сетке.
Подобные документы
Описание жанровых характеристик немецкоязычных новостных текстов. Структурные особенности и классификация новостных текстов качественной немецкоязычной прессы. Стилистическая характеристика заголовков. Взаимосвязь заголовка и новостного текста.
автореферат, добавлен 29.11.2017Обзор существующих подходов и средств выравнивания параллельных текстов, их сильные стороны и недостатки. Методология подготовки данных для алгоритмов машинного обучения, применяемых для выравнивания, основанную на идеях функциональной семантики.
курсовая работа, добавлен 11.06.2018Исследование методов и алгоритмов анализа. Возможности использования статистических параметров текстов в качестве авторской характеристики. Алгоритм определения статистических параметров текста, позволяющий выполнить компьютерную обработку текстов.
статья, добавлен 09.09.2021Рассмотрение признаков, характерных для текстов, написанных в состоянии фрустрации. Особенности метода Random Forest. Знакомство с результатами пилотажного исследования применения лингвистического анализатора, компьютерного инструмента "Машина РСА".
статья, добавлен 31.03.2021Лингводидактический потенциал новостных текстов в формировании политической компетенции будущего переводчика. Структура указанной компетенции. Преимущества и недостатки использования для ее формирования новостных текстов различных каналов распространения.
статья, добавлен 02.01.2019Общая характеристика ключевых проблем обработки естественного языка с использованием вычислительной техники. Рассмотрение основных особенностей классификации древнетибетских текстов с помощью методов спектрального анализа. Сущность понятия "атрибуция".
курсовая работа, добавлен 02.12.2018Прагматические механизмы построения подобных комических текстов как оценочные и выводные несоответствия между положениями дел. Знакомство с семиотическими характеристиками интерпретации комических текстов, характеристика моделей алгоритмов создания.
статья, добавлен 15.03.2021Разработка инструментов автоматического извлечения требуемой информации из текстов. Векторное представление русскоязычных текстов. Проведение маркетинговых исследований и мониторинга лояльности аудитории к конкретной теме или бренду в социальных медиа.
статья, добавлен 09.10.2020Нетрадиционная типология художественных текстов. Восемь классов письменных текстов в зависимости от выполняемой ими функции. Жанрово-стилистическое расслоение устных текстов по признаку более или менее официальной сферы общения. Анализ типологии текстов.
статья, добавлен 02.10.2018Характеристика машинного перевода как процесса перевода текстов с одного языка на другой с помощью специальной компьютерной программы. Анализ развития машинного перевода. Изучение статистического машинного перевода. Гибридные средства машинного перевода.
презентация, добавлен 12.06.2020Словообразовательные механизмы неологического сегмента медийных текстов американских новостных Интернет-изданий. Выделено девять продуктивных словообразовательных моделей, которые можно объединить в 3 группы: безаффиксную, аффиксальную и смешанную.
статья, добавлен 14.11.2020Составление "золотого стандарта" антонимов для русского языка. Реализация механизма поиска антонимов с помощью метода "ближайшее слово" и метода аналогического вывода. Разработка способа поиска антонимов на основе линейного преобразования матриц.
реферат, добавлен 21.06.2016Анализ лингвистических характеристик и свойств текстов рубрики "Faits divers", достоинства и недостатки данных текстов при их дидактическом применении. Изучение рубрики ряда французских изданий и разработка тестовых заданий на основе отобранных текстов.
статья, добавлен 07.04.2022Область применения автоматической адаптации текстов, понятие их удобочитаемости. Оценка работы упрощающих систем и этапы реализации соответствующего алгоритма. Выбор лучшего кандидата в рассматриваемом контексте. Формирование упрощенных текстов.
дипломная работа, добавлен 28.11.2019Исследование проблемы использования аутентичных текстов на уроках английского языка, суть которой заключается в трудности перевода данных текстов. Характеристика специфики аутентичных текстов с различными грамматическими и лексическими особенностями.
статья, добавлен 21.06.2020Построение матрицы TF-IDF для классификации текстов по обозначенным категориям. Процесс преобразования исходных текстов для сокращения количества уникальных словоформ и получения списка ключевых термов: лемматизация, стемминг, удаление стоп-слов.
статья, добавлен 02.05.2022Применение современных методов работы, необходимость использования Интернет-источников. Анализ ряда ресурсов, которые могут быть полезными в лексикографической работе для поиска и отбора наиболее релевантных коллокаций из массива Интернет-текстов.
статья, добавлен 20.05.2021Установление взаимосвязи ритмических параметров текстов с качеством их воздействия на читателей и анализ восприятия информации посредством анализа ритма текстов разных стилей. Определение оптимального объема текста для анализа его ритмических параметров.
реферат, добавлен 19.09.2017Рассматривается проблема перевода юридических текстов средствами автоматизированного машинного перевода и средствами Translation memory. Основные сложности, возникающие при переводе юридических текстов, вызванные особенностью юридического дискурса.
статья, добавлен 12.09.2021Возможности перевода юридических текстов средствами автоматизированного машинного перевода и средствами Translation memory. Работа переводчика с большим корпусом текстов фиксированной тематики. Сложности, возникающие при переводе юридических терминов.
статья, добавлен 05.10.2021Основные принципы использования публицистических текстов на уроках русского языка как иностранного. Применение иллюстративного, имитативного и аналитического способов обучения. Использование элементов совершенно разных стилей в современной публицистике.
статья, добавлен 27.09.2018Осмысление параметров эколингвистики и трактовка языковых явлений с позиций экологии. Модель взаимодействия человека и окружающей среды, принципы анализа новостных текстов экологической тематики. Оценка насыщенности текстов разговорными лексемами.
статья, добавлен 27.12.2018Выявление месторасположений фраз предопределенных категорий в тексте. Составление правил и эвристик, сформированных вручную экспертами в области лингвистики. Методы машинного обучения для выделения именованных сущностей из текстов на русском языке.
дипломная работа, добавлен 28.08.2016Передача рекламных текстов. Стремление к достижению максимального эффекта. Работа К. Райс "Классификация текстов и методы перевода". Учет лингвистических и экстралингвистических особенностей, вида рекламы и целевой группы при переводе рекламных текстов.
статья, добавлен 27.09.2018Жанровые черты немецкоязычных новостных текстов, их структурные черты и классификация. Заголовки новостного контента качественной немецкоязычной прессы. Особенности их перевода, стилистическая характеристика. Особенности взаимосвязи с новостным текстом.
автореферат, добавлен 26.12.2015