Методи класифікації текстових документів в задачах Text Mining
Дослідження найбільш поширених математичних методів класифікації текстових документів. Використання критеріїв інформаційної ваги слова в рубриці. Застосування наївного Байєсівського класифікатора в задачах для фільтрації спаму та автоматичної рубрикації.
Подобные документы
Класифікація систем підготовки текстових документів, їх відмінні особливості та умови практичного використання. Редактори текстів, їх функції, асортимент та значення. Настільні видавничі системи, їх можливості. Етапи підготовки текстових документів.
реферат, добавлен 24.06.2011- 2. Моделі та методи класифікації текстових документів в спеціалізованих інформаційно-пошукових системах
Принципи створення електронного документообігу. Розробка системи автоматизованої класифікації документів управління митної служби України. Вивчення алгоритмів роботи глобальних комп’ютерних мереж. Апробація і реалізація інформаційно-пошукових програм.
автореферат, добавлен 27.08.2014 Аналіз основних методів кластеризації політематичних текстових документів. Розробка моделі адаптивної нечіткої нейронної мережі. Структура та функції інструментальних засобів вирішення прикладних задач. Зміст генетичного методу зі штучним відбором.
автореферат, добавлен 20.07.2015Підходи до класифікації електронних документів мережного середовища. Види різнотипних файлів (текстових, графічних, звукових) та інформаційні ресурси сервісів інтернет-середовища. Найбільш розроблені тематичні класифікатори в каталогах Інтернету.
статья, добавлен 14.09.2016Розробка моделі семантичного анотування текстових документів з урахуванням бінарних виходів штучної нейронної мережі та ймовірнісної моделі семантичного анотування для формування RDF-описів. Функції інструментальних засобів вирішення прикладних задач.
автореферат, добавлен 19.06.2018Ознайомлення з розширеними можливостями текстових процесорів та прийомами їх використання. особливості реалізації перевірки правопису у текстовому процесорі, роботи технології OLE, роботи з таблицями у документах MS Word. Засоби автоматизації MS Word.
лабораторная работа, добавлен 07.07.2017Методи векторного представлення й обробки візуальної і текстової інформації в задачах пошуку і класифікації. Добір бінарних ознак, що засновані на використанні критеріїв інформативності і надмірності. Реалізація інтелектуальних інформаційних технологій.
автореферат, добавлен 28.08.2014Розробка сучасних технологій розпізнавання тексту з метою розпізнавання плоских сканованих документів. Алгоритм корекції перспективних спотворень на основі виявлення точки сходження. Визначення горизонтальних базових текстових ліній, вертикальних штрихів.
статья, добавлен 14.09.2016Дослідження питання використання засобів абдуктивних міркувань для задач видобування даних. Інтерпретація моделей класифікації на основі дерев рішень абдуктивним способом з використанням доменних обмежень у випадку часткової відсутності вхідних даних.
статья, добавлен 24.11.2016Використання методів машинного навчання та технологій штучного інтелекту для вирішення проблем виникнення, розповсюдження та фільтрації спаму в Україні. Використання програмного забезпечення Jupiter notebook для обробки й аналізу даних поштових серверів.
статья, добавлен 19.09.2024Використання алгоритмів локально чутливого хешування як способу збільшення повноти вибірки у процесі перевірки текстових документів системою пошуку збігів. Графічне представлення визначення коефіцієнта Жаккара. Особливості оптимізації методу шинглів.
статья, добавлен 27.07.2016Аналіз предметної області та відомих реалізацій програмної системи конвертації текстових файлів. Розробка алгоритмів функціонування основних модулів програмної системи конвертації текстових файлів. Характеристика сутності інформаційної технології.
курсовая работа, добавлен 11.10.2017Поняття інтелектуального аналізу даних (Data Mining), їх розвідка. Виникнення і розвиток Data Mining. Сутність та мета технології. Етапи розв'язування задачі класифікації та регресії. Пошук асоціативних правил. Особливості кластеризації об'єктів.
реферат, добавлен 09.07.2017Структурні методи розпізнавання зображень документів. Придатність апарату двовимірних контекстно-вільних граматичних конструкцій для розв'язання класів практичних задач розпізнавання семантично насичених зображень зі складною ієрархічною структурою.
автореферат, добавлен 29.09.2015Метод класифікації текстур за їх гістограмними характеристиками та за використанням декількох еталонних геозображень. Інформаційна технологія, що базується на спільному використанні методів класифікації. Ефективність розробленої інформаційної технології.
автореферат, добавлен 25.07.2015- 16. Методи розпізнавання та класифікації станів систем управління засобами нейромережевих технологій
Дослідження методики застосування нейромережевих технологій для передбачення ймовірних станів у системах керування і управління багатопараметричними об’єктами, визначення нелінійності класифікатора для оцінки функціонування нейромережевого класифікатора.
автореферат, добавлен 27.07.2014 Вивчення методики підвищення якості обробки електронних документів, що містять природно-мовні тексти, можливо з помилками. Розробка автоматизованої системи термінологічного та інтерпретаційного аналізу електронних текстових документів, що містять помилки.
автореферат, добавлен 29.08.2015Методи векторного представлення символьних послідовностей, що зберігають схожість за відстанню редагування. Дослідження методів пошуку схожих символьних послідовностей за допомогою розподілених представлень. Програмні засоби, що реалізують ці методи.
автореферат, добавлен 14.09.2015Параметризація мовного голосового сигналу. Розробка методик й алгоритмів класифікації отриманих сегментів мовного голосового сигналу та розпізнавання фонем. Інформаційна технологія попередньої обробки мовного голосового сигналу і класифікації фонем.
автореферат, добавлен 28.08.2015Методи аналізу даних за допомогою інформаційних систем. Консолідація та візуалізація даних в задачах інформаційного бізнесу. Задача асоціації в Data Mining. Кластеризація алгоритмів типу k-means та g-means. Прогнозуючі та класифікаційні моделі.
курсовая работа, добавлен 06.02.2012Огляд існуючих методів класифікації для розв’язання задач видобування даних, їх можливостей та недоліків. Створення методів та високоефективних інформаційних технологій класифікації на основі нейроподібних структур моделі геометричних перетворень.
автореферат, добавлен 28.08.2015Базові архітектури та методи навчання статичних та динамічних штучних нейронних мереж для розв’язання задач апроксимації, фільтрації, ідентифікації та класифікації. Метод автоматичної побудови адаптивної схеми дискретизації вхідних сигналів у ШНМ СМАС.
автореферат, добавлен 20.07.2015- 23. Дослідження методів векторизації текстів у задачах валідації відповідей, поданих природною мовою
Інтелектуалізація процесу обробки природномовних текстів у задачах автоматизованого тестування. Метою є дослідження моделей, методів векторизації текстів у задачах обробки відповідей, поданих природною мовою. Базові прикладні задачі обробки текстів.
статья, добавлен 13.10.2022 Аналіз засобів захисту документів та цінних паперів і визначення поліграфічних методів їх створення. Розробка моделі засобів захисту документів на основі використання формальних граматик, сумісного використання теорії графів та принципів стеганографії.
автореферат, добавлен 20.07.2015Аналіз методів та формулювання принципів побудови штучних імунних і гібридних систем інтелектуального аналізу даних. Розроблення методів і засобів структурно-параметричного синтезу нейронних мереж для розв'язання задач прогнозування та класифікації.
автореферат, добавлен 20.07.2015