Выделение ключевых слов для классификации текстов
Построение матрицы TF-IDF для классификации текстов по обозначенным категориям. Процесс преобразования исходных текстов для сокращения количества уникальных словоформ и получения списка ключевых термов: лемматизация, стемминг, удаление стоп-слов.
Подобные документы
Анализ новогодних поздравлений, представляющих собой один из жанров политического дискурса. Описание структурных и лингвистических особенностей текстов новогодних обращений глав государств Германии и Украины. Изучение классификации политических текстов.
статья, добавлен 07.10.2021Рассматриваются проблемы, связанные с переводом стихотворных текстов, а также с определением синтаксической эквивалентности оригинального и переводного текстов на уровне сложного предложения. Разработана методика, основанная на теоретико-графовых моделях.
статья, добавлен 23.12.2018Анализ использования ряда лингвистических приемов и закономерностей в рекламной деятельности. Выделение рекламного языка из других видов текстов. Рассмотрение основных видов сравнений, используемых в рекламе. Эмоциональное апеллирование в рекламе.
статья, добавлен 20.01.2018Выделение ключевых слов из текста с помощью автоматизированной системы TextAppliance. Особенности процесса разработки технологии выделения из текста слов и субстантивных словосочетаний, обладающих комплексом основных характеристик ключевого слова.
статья, добавлен 29.07.2021Классификация и типы переводов по жанровой принадлежности оригинала. Лексико-грамматические особенности и терминология перевода специальных текстов. Основные проблемы перевода терминов английских экономических текстов на русский и казахский языки.
курсовая работа, добавлен 11.12.2013- 81. Поиск ключевых слов в корпусе Р.М. Рильке в условиях ограниченного доступа к референтному корпусу
Полуавтоматизированный способ нахождения ключевых слов в корпусе путем сравнения логарифмического правдоподобия их появления в двух корпусах в условиях ограниченного доступа к референтному корпусу. Подходы к определению репрезентативности корпуса.
статья, добавлен 10.05.2018 Лингвистическая проблема построения неформальной классификации рекламы, содержащей игру слов. Применение когнитивно-прагматического подхода к изучению языковых единиц. Анализ классификации с учетом характера объекта, обыгрываемого в рекламном слогане.
статья, добавлен 23.01.2022Рассмотрение новых подходов к анализу взаимодействия словесной и визуальной (видео) частей текста. Выделение разновидностей сочетания видеовербалики: иллюстрация, дополнение, контраст, коннотация и ассоциация. Категория видео-вербальных текстов.
статья, добавлен 19.04.2018Анализ языковых и лингвистических проблем при переводе иноязычного текста. Изучение особенностей перевода медицинского и художественного текстов и используемых при этом трансформаций на грамматическом и лексическом уровне. Пример перевода двух текстов.
курсовая работа, добавлен 29.01.2013Рекламный слоган как особый вид рекламного текста. Роль перевода в современном мире. Анализ синтаксических особенностей рекламных текстов. Классификация рекламных текстов по типу восприятия. Соединение рекламной идеи со средствами выразительности.
курсовая работа, добавлен 04.12.2017Анализ психолингвистического содержания образных репрезентаций текстов иностранных и русских, комментариев. Графический образ восприятия текстов на родном языке и иностранном языке. Когнитивные стереотипы, актуализирующиеся в сознании русскоязычных людей.
статья, добавлен 24.03.2018Возможность использования разработанной Институтом прикладной и математической лингвистики МГЛУ методики глубинного аннотирования поликодовых текстов в качестве лингводидактического инструмента. Особое внимание уделяется аннотированию текстов в Интернете.
статья, добавлен 29.05.2022Рассмотрение лексических проблем перевода технических документов на материале авиационных текстов. Выбор вариантов перевода, учет многозначности терминов авиационной тематики. Основные лексические признаки терминологии научно-технических текстов.
статья, добавлен 28.01.2019Разработка инструментов автоматического извлечения требуемой информации из текстов. Векторное представление русскоязычных текстов. Проведение маркетинговых исследований и мониторинга лояльности аудитории к конкретной теме или бренду в социальных медиа.
статья, добавлен 09.10.2020Схема анализа текстов и сложности перевода публицистическо-биографических текстов. Практика применения лексико-грамматических особенностей перевода на примере текстов биографии и выступлений А. Адамса. Особенности перевода текста обращения А. Кертеса.
курсовая работа, добавлен 17.12.2014Рассматривается проблема перевода юридических текстов средствами автоматизированного машинного перевода и средствами Translation memory. Основные сложности, возникающие при переводе юридических текстов, вызванные особенностью юридического дискурса.
статья, добавлен 12.09.2021Методологические возможности и границы лингвистического анализа отраслевых текстов по виноделию. Исследование языковых явлений в области лингвистики, ориентированной на проблему интеграции языка и сознания, речи и мышления при анализе отраслевых текстов.
статья, добавлен 10.01.2019Анализ содержательно-смысловой структуры текстов, описание реализуемых в них основных функций. Связь между коммуникативно-прагматическими функциями текстов инструкций по применению лекарственных препаратов и характером их восприятия и понимания.
статья, добавлен 25.01.2019Ознакомление с внутристилевой дифференциацией текстов официально-делового стиля, "жанрах и критериях их выделения". Анализ материалов следственно-судебного подстиля с целью определения коммуникативно-речевой функции и специфики текстов приговора суда.
реферат, добавлен 26.10.2018Возможности перевода юридических текстов средствами автоматизированного машинного перевода и средствами Translation memory. Работа переводчика с большим корпусом текстов фиксированной тематики. Сложности, возникающие при переводе юридических терминов.
статья, добавлен 05.10.2021Анализ лексических аспектов перевода патентной документации как жанра научно-технических текстов. Анализ штампов и клише, синонимов, многозначных слов, архаизмов и канцеляризмов, имеющихся в контексте патентных документов. Особенности перевода таких слов.
статья, добавлен 28.01.2019Установление взаимосвязи ритмических параметров текстов с качеством их воздействия на читателей и анализ восприятия информации посредством анализа ритма текстов разных стилей. Определение оптимального объема текста для анализа его ритмических параметров.
реферат, добавлен 19.09.2017Особенности экономического и учебного дискурсов и их влияние на формирование учебных экономических текстов. Лингвистический механизм взаимодействия указанных дискурсов, создающий языковое своеобразие учебных текстов экономической направленности.
автореферат, добавлен 09.11.2010Исследование методов и алгоритмов анализа. Возможности использования статистических параметров текстов в качестве авторской характеристики. Алгоритм определения статистических параметров текста, позволяющий выполнить компьютерную обработку текстов.
статья, добавлен 09.09.2021- 100. Типология текстов оценочного типа и их параметральные характеристики (на материале жанра фельетона)
Выделение типологических особенностей текстов оценочного типа, обеспечивающих условия правильной, удачной коммуникации. Анализ факторов коммуникативно-прагматической структуры произведения, влияющих на семантическую и структурную организацию текста.
статья, добавлен 14.10.2018