Следует отметить, что участие двух компонент в дифференциации объектов неодинаково. Первая компонента имеет наибольшую дисперсию (2.1) и на 70% исчерпала информацию об изменчивости признаков (табл. 9.9), тогда как на долю второй приходится всего 24%. Получается, что роль этой компоненты ниже, чем роль любого из исходных признаков (на каждый из них приходится по 33%), и вторая компонента (как и третья) не должна бы участвовать в дальнейшем рассмотрении. В компонентном анализе обычно используется содержательный критерий значимости: компоненты с дисперсией менее 1 не рассматриваются. Это справедливо для небольших объемов выборок (десятки объектов), но для обширных выборок может оказаться неверным. Для этого предлагается формальный критерий оценки значимости компонент, проверяющий нулевую гипотезу о равенстве дисперсий k компонент: S2i = S2i+1 = … = S2k. Если дисперсии компонент равны, значит, они не используют общей информации о коррелированности исходных признаков, не являются общими факторами, не сказываются на признаках, т. е. незначимы. Критерий имеет χ²-распределение с степенями свободы: ( χ²(α,df), где n – объем выборки, k – число рассматриваемых компонент, i – номер начальной учитываемой компоненты, S 2 – дисперсия компоненты. Проверим гипотезу о равенстве трех главных компонент. Для уровня значимости α = 0.05 имеем i = 1, k = 3, df = 7, n = 17, χ²(0.05,7) = 4.07, S 21 = 2.1, S22 = 0.71, S 23 = 0.19, = 20.18. Полученное значение (20.18) больше табличного (14.07), следовательно, дисперсии трех компонент отличаются достоверно. Проверяя гипотезу о равенстве второй и третьей компонент, получим i = 1, k = 2, df = 2, n = 17, χ² = 5.99, S 22 = 0.71, S 23 = 0.19, = 4.9. На сей раз полученное значение (4.9) меньше табличного (5.99), дисперсии второй и третьей компонент отличаются недостоверно. Вывод очевиден: первая (значимая) компонента выделяется среди прочих (незначимых) компонент по информационной насыщенности. Специфика исходных трех переменных воплотилась в единственный расчетный признак, первую главную компоненту.
Ви переглядаєте статтю (реферат): «Информативность и значимость компонент» з дисципліни «Введення в кількісну біологію»