Bayes classification of the text documents. Hierarchical clustering on the basis of frequent itemsets

Яна Сергіїна Свириденко

Abstract


This article considers Bayes classification of text documents. For a more detailed analysis and practical use of the new approach for document clustering - hierarchical clustering based on frequent itemsets (FIHC), which is based on the idea of frequent itemsets.

Keywords


Bayes classification, document, text, program, object, class, frequent itemsets, clustering

References


Автоматична класифікація текстів [Електронний ресурс] / Юрій Лифшиц. – Режим доступу: http://logic.pdmi.ras.ru/ ~yura/internet/ 06ia.pdf – 25.11.2006 р. – Загол. з екрану.

Agrawal, R. Fast algorithm for mining association rules [Текст] – L.: Proc. 20th Int. Conf. Very Large Data Bases, 1994. – 487 p.

Classic [Електронний ресурс] / K. Readman. – Режим доступу: ftp://ftp.cs.cornell.edu/pub/smart/ – 7.11.2002 р. – Загол. з екрану.

Вапник, В. Н. Теорія розпізнавання образів [Текст] / В. Н Вапник, А. Я Червоненкис. – М.: Наука, 1974. – 598 с.

Прикладна статистика: класифікація й зниження розмірності [Текст] / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин. – М.: Фінанси й статистика, 1989. – 457 с.


GOST Style Citations








Copyright (c) 2014 Яна Сергіїна Свириденко

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

ISSN (print) 1729-3774, ISSN (on-line) 1729-4061