Классификация медиа-текстов с использованием машинного обучения

Описание применения алгоритмов random forest ("случайный лес") и support vector machine (метод опорных векторов) для классификации текстов новостных изданий. Поиск оптимальных параметров для работы алгоритмов с помощью случайного поиска и поиска по сетке.

Подобные документы

  • Описание жанровых характеристик немецкоязычных новостных текстов. Структурные особенности и классификация новостных текстов качественной немецкоязычной прессы. Стилистическая характеристика заголовков. Взаимосвязь заголовка и новостного текста.

    автореферат, добавлен 29.11.2017

  • Обзор существующих подходов и средств выравнивания параллельных текстов, их сильные стороны и недостатки. Методология подготовки данных для алгоритмов машинного обучения, применяемых для выравнивания, основанную на идеях функциональной семантики.

    курсовая работа, добавлен 11.06.2018

  • Исследование методов и алгоритмов анализа. Возможности использования статистических параметров текстов в качестве авторской характеристики. Алгоритм определения статистических параметров текста, позволяющий выполнить компьютерную обработку текстов.

    статья, добавлен 09.09.2021

  • Рассмотрение признаков, характерных для текстов, написанных в состоянии фрустрации. Особенности метода Random Forest. Знакомство с результатами пилотажного исследования применения лингвистического анализатора, компьютерного инструмента "Машина РСА".

    статья, добавлен 31.03.2021

  • Лингводидактический потенциал новостных текстов в формировании политической компетенции будущего переводчика. Структура указанной компетенции. Преимущества и недостатки использования для ее формирования новостных текстов различных каналов распространения.

    статья, добавлен 02.01.2019

  • Общая характеристика ключевых проблем обработки естественного языка с использованием вычислительной техники. Рассмотрение основных особенностей классификации древнетибетских текстов с помощью методов спектрального анализа. Сущность понятия "атрибуция".

    курсовая работа, добавлен 02.12.2018

  • Прагматические механизмы построения подобных комических текстов как оценочные и выводные несоответствия между положениями дел. Знакомство с семиотическими характеристиками интерпретации комических текстов, характеристика моделей алгоритмов создания.

    статья, добавлен 15.03.2021

  • Разработка инструментов автоматического извлечения требуемой информации из текстов. Векторное представление русскоязычных текстов. Проведение маркетинговых исследований и мониторинга лояльности аудитории к конкретной теме или бренду в социальных медиа.

    статья, добавлен 09.10.2020

  • Нетрадиционная типология художественных текстов. Восемь классов письменных текстов в зависимости от выполняемой ими функции. Жанрово-стилистическое расслоение устных текстов по признаку более или менее официальной сферы общения. Анализ типологии текстов.

    статья, добавлен 02.10.2018

  • Характеристика машинного перевода как процесса перевода текстов с одного языка на другой с помощью специальной компьютерной программы. Анализ развития машинного перевода. Изучение статистического машинного перевода. Гибридные средства машинного перевода.

    презентация, добавлен 12.06.2020

  • Словообразовательные механизмы неологического сегмента медийных текстов американских новостных Интернет-изданий. Выделено девять продуктивных словообразовательных моделей, которые можно объединить в 3 группы: безаффиксную, аффиксальную и смешанную.

    статья, добавлен 14.11.2020

  • Составление "золотого стандарта" антонимов для русского языка. Реализация механизма поиска антонимов с помощью метода "ближайшее слово" и метода аналогического вывода. Разработка способа поиска антонимов на основе линейного преобразования матриц.

    реферат, добавлен 21.06.2016

  • Анализ лингвистических характеристик и свойств текстов рубрики "Faits divers", достоинства и недостатки данных текстов при их дидактическом применении. Изучение рубрики ряда французских изданий и разработка тестовых заданий на основе отобранных текстов.

    статья, добавлен 07.04.2022

  • Область применения автоматической адаптации текстов, понятие их удобочитаемости. Оценка работы упрощающих систем и этапы реализации соответствующего алгоритма. Выбор лучшего кандидата в рассматриваемом контексте. Формирование упрощенных текстов.

    дипломная работа, добавлен 28.11.2019

  • Исследование проблемы использования аутентичных текстов на уроках английского языка, суть которой заключается в трудности перевода данных текстов. Характеристика специфики аутентичных текстов с различными грамматическими и лексическими особенностями.

    статья, добавлен 21.06.2020

  • Построение матрицы TF-IDF для классификации текстов по обозначенным категориям. Процесс преобразования исходных текстов для сокращения количества уникальных словоформ и получения списка ключевых термов: лемматизация, стемминг, удаление стоп-слов.

    статья, добавлен 02.05.2022

  • Применение современных методов работы, необходимость использования Интернет-источников. Анализ ряда ресурсов, которые могут быть полезными в лексикографической работе для поиска и отбора наиболее релевантных коллокаций из массива Интернет-текстов.

    статья, добавлен 20.05.2021

  • Установление взаимосвязи ритмических параметров текстов с качеством их воздействия на читателей и анализ восприятия информации посредством анализа ритма текстов разных стилей. Определение оптимального объема текста для анализа его ритмических параметров.

    реферат, добавлен 19.09.2017

  • Рассматривается проблема перевода юридических текстов средствами автоматизированного машинного перевода и средствами Translation memory. Основные сложности, возникающие при переводе юридических текстов, вызванные особенностью юридического дискурса.

    статья, добавлен 12.09.2021

  • Возможности перевода юридических текстов средствами автоматизированного машинного перевода и средствами Translation memory. Работа переводчика с большим корпусом текстов фиксированной тематики. Сложности, возникающие при переводе юридических терминов.

    статья, добавлен 05.10.2021

  • Основные принципы использования публицистических текстов на уроках русского языка как иностранного. Применение иллюстративного, имитативного и аналитического способов обучения. Использование элементов совершенно разных стилей в современной публицистике.

    статья, добавлен 27.09.2018

  • Выявление месторасположений фраз предопределенных категорий в тексте. Составление правил и эвристик, сформированных вручную экспертами в области лингвистики. Методы машинного обучения для выделения именованных сущностей из текстов на русском языке.

    дипломная работа, добавлен 28.08.2016

  • Осмысление параметров эколингвистики и трактовка языковых явлений с позиций экологии. Модель взаимодействия человека и окружающей среды, принципы анализа новостных текстов экологической тематики. Оценка насыщенности текстов разговорными лексемами.

    статья, добавлен 27.12.2018

  • Передача рекламных текстов. Стремление к достижению максимального эффекта. Работа К. Райс "Классификация текстов и методы перевода". Учет лингвистических и экстралингвистических особенностей, вида рекламы и целевой группы при переводе рекламных текстов.

    статья, добавлен 27.09.2018

  • Жанровые черты немецкоязычных новостных текстов, их структурные черты и классификация. Заголовки новостного контента качественной немецкоязычной прессы. Особенности их перевода, стилистическая характеристика. Особенности взаимосвязи с новостным текстом.

    автореферат, добавлен 26.12.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу и оценить ее, кликнув по соответствующей звездочке.