Существует большое количество различных способов разбиения заданной совокупности элементов на классы. Поэтому представляет интерес задача сравнительного анализа качества этих способов разбиения Q(S), определенного на множестве всех возможных разбиений. Тогда под наилучшим разбиением S* понимаем такое разбиение, при котором достигается экстремум выбранного функционала качества. Следует отметить, что выбор того или иного функционала качества, как правило, опирается на эмпирические соображения. Рассмотрим наиболее распространенный функционал качества разбиения. Пусть исследователем выбрана метрика ρ в пространстве Х и пусть S = (S1, S2,..., Sp) — некоторое фиксированное разбиение наблюдений x1, ..., xn на заданное число p классов S1, S2, ..., Sp. За функционал качества берут сумму («взвешенную») внутриклассовых дисперсий
(53.51)
где xl — вектор средних для l-го кластера.
Ви переглядаєте статтю (реферат): «Функционалы качества разбиения» з дисципліни «Курс соціально-економічної статистики»