Методи класифікації текстових документів в задачах Text Mining
Дослідження найбільш поширених математичних методів класифікації текстових документів. Використання критеріїв інформаційної ваги слова в рубриці. Застосування наївного Байєсівського класифікатора в задачах для фільтрації спаму та автоматичної рубрикації.
Подобные документы
З яких пристроїв складається внутрішня пам'ять. Повторне форматування диска. Текстовий редактор Miсrosoft Word 2000. Режими відображення документа. Створення нового документа. Відкриття, збереження та закриття документа. Редагування текстових документів.
реферат, добавлен 08.11.2017Оцінювання подібності текстових документів за їх змістом у метапошукових системах. Методи та алгоритми адаптації онтології до інформаційних потреб користувачів на основі вдосконалення визначення коефіцієнтів важливості понять та зв'язків між ними.
автореферат, добавлен 30.08.2014Аналіз існуючих методів параметризації мовного сигналу, його цифрової обробки та розпізнавання. Розробка алгоритму попередньої обробки голосових команд, що полягає в зниженні рівня шуму і знаходженні границь слів за допомогою методів вейвлет-аналізу.
автореферат, добавлен 24.07.2014Аналіз зарубіжних нормативно-методичних документів, які регулюють застосування технологій оцифровування архівних документів. Дослідження досвіду оцифровування архівних документів у рамках міжнародних та національних проектів. Особливості технічних звітів.
статья, добавлен 02.11.2018Розгляд можливості використання генетичного алгоритму в задачах про комівояжера. Методика використання операторів генетичного алгоритму, пристосованого для розв’язання задач великої розмірності. проектування інформаційних та обчислювальних комплексів.
статья, добавлен 29.01.2019Розгляд основних способів введення, виділення, переміщення і видалення тексту. Характеристика засобів для створення текстових фреймів. Настроювання параметрів абзацу. Використання спеціальних текстових символів. Перевірка правопису, пошук і заміна тексту.
реферат, добавлен 15.03.2015Аналіз моделей, методів розкрою та пакування матеріалу та простору, основних існуючих обчислювальних методів, математичних моделей та методик розв’язку задач одновимірного розкрою. Метод генерації лінійних комбінацій цін матеріалу на основі бітових полів.
автореферат, добавлен 26.07.2014Аналіз засобів автоматизованого виправлення орфографічних помилок в природномовних текстових даних. Розробка контекстно-асоціативних методів орфокорекції для підвищення роботи програмного забезпечення за показниками швидкості виправлення помилок.
автореферат, добавлен 26.09.2015Характеристика видів текстових документів. Створення нового вікна та проведення налагодження параметрів сторінки, абзацу, шрифту. Встановлення мови вводу документа, перевірка орфографії та його збереження. Редагування, здійснення копіювання фрагменту.
реферат, добавлен 05.02.2010Поняття економічної інформації, основні її ознаки і характерні особливості, методи класифікації. Призначення інформаційних систем в економіці, їх призначення, ознаки класифікації. Принципи побудови управління економічними інформаційними системами.
реферат, добавлен 05.04.2010Огляд математичних моделей систем марковського типу, параметри яких стрибкоподібно змінюються у часі. Методи стабілізації, розрахунку розподілів станів зазначених систем. Їх застосування в задачах хімії, біології, техніки, системі масового обслуговування.
автореферат, добавлен 26.08.2014Етапи розвитку та види сучасних інформаційних технологій. Класифікація систем підготовки текстових документів, функції редакторів та настільних видавничих систем. Набір, редагування, форматування текстів. Удосконалення програм для роботи з документацією.
курсовая работа, добавлен 08.05.2012Характеристика методу і засобів для виділення знань з природномовного тексту. Аналіз багатоетапного алгоритму, що містить ієрархічну кількарівневу процедуру розпізнавання понять, зв’язків, предикатів та правил, які в результаті вносяться до онтології.
статья, добавлен 29.08.2016Розробка математичних моделей сигналів інформаційної взаємодії людини і комп’ютера у процесах психометричного тестування. Аналіз методів формування бази даних для підтримки прийняття рішень в автоматизованих комп’ютерних системах психодіагностики.
автореферат, добавлен 19.07.2015Визначення поняття текстових редакторів, їх функції та роль у сучасному світі. Інтерфейс текстового процесора Microsoft Word. Створення та відкриття документів, їх формати та правила збереження. Введення і коригування тексту та спеціальних символів.
лекция, добавлен 18.11.2014Операційна система Windows XP. Поняття на принципи роботи у системі. Структура файлової системи. Робота з файлами та папками, їх створення, переміщення та копіювання. Створення ярликів, пошук файлів та папок. Програма "Провідник" для керування файлами.
контрольная работа, добавлен 01.10.2017Розгляд різних аспектів штучного інтелекту та його застосування в сучасному світі. Вивчення основних методів та систем штучного інтелекту. Особливості побудови математичних моделей для опису процесів навчання і функціонування штучних нейронних мереж.
статья, добавлен 29.07.2024Мета технології Data Mining - знаходження в даних закономірностей, які не можуть бути знайдені традиційними методами. Види моделей (предиктивні та описові). Використання методів й алгоритмів Data Mining для побудови моделей. Класифікація стадій та фаз.
реферат, добавлен 22.07.2017Способи модифікації текстових даних документа зі збереженням відповідності модифікованого документа оригінальному. Можливості прямої обробки форматів MS Word, PDF та їх конвертація. Розгляд трьох основних форматів збереження документів: DOC, DOCX І PDF.
статья, добавлен 21.06.2016Теоретичне доведення доцільності та придатності апарату двовимірних контекстно-вільних граматичних конструкцій з виділеними сегментами для розв'язання практичних задач розпізнавання семантично насичених зображень зі складною ієрархічною структурою.
автореферат, добавлен 29.09.2014Обґрунтування використання функції ентропії як критерію якості нечіткої кластеризації. Постановка й дослідження нових задач нечіткої кластеризації з використанням функції ентропії. Розробка методів та алгоритмів розв’язання сформульованих задач.
автореферат, добавлен 29.07.2015проектування та розробка web-сервісу для автоматичної генерації, розсипки на email та перевірки PDF-сертифікатів або інших PDF-документів, який може працювати незалежно або в інтеграції з іншими програмними продуктами. Основні функції web-сервісу.
статья, добавлен 13.05.2024Особливість підготовки текстових документів на комп'ютері. Синтез операцій введення, редагування та форматування. Отримання навиків роботи з піктографічним меню і командами стандартної панелі інструментів. Аналіз відображення недрукованих символів.
лабораторная работа, добавлен 16.07.2017Зовнішній, інфологічний, даталогічний, внутрішній рівні проектування даних. Методи проектування інформаційних систем і їх класифікація. Ієрархічна і багатоаспектна системи класифікації економічної інформації. Завантаження і ведення інформаційної бази.
контрольная работа, добавлен 12.09.2009Значення електронного гербарію Турчанінова для ботаніків. Розробка концептуальної моделі бази даних типових зразків новоописів. Головне інтерфейсне вікно для операцій введення та редагування текстових файлів. Використання можливості фільтрації записів.
статья, добавлен 17.04.2014