Используя наши данные по гадюкам (W – масса тела, Lt – длина тела, Lc – длина хвоста), рассмотрим расчет таких "корреляционных компонент", аналогов главных компонент (табл. 9.6, 9.7). Если рассчитать корреляции между тремя признаками, получим всего шесть коэффициентов (включая автозависимости, r = 1.00).
Таблица 9.6 Матрица корреляций W Lt Lc W 1.00 0.79 -0.49 Lt 0.79 1.00 -0.33 Lc -0.49 -0.33 1.00
Возьмем в качестве факторных (точнее, "корреляционных") нагрузок первый столбец коэффициентов, выражающий сопряжение трех признаков с массой тела змеи: r11 = rWW = 1.00, r12 = rWLt = 0.789, r13 = rWLc = –0.492. Тогда уравнение первой корреляционной компоненты примет вид: . Рассчитаем значения компонент, новых признаков, для конкретных особей (для простоты обойдемся без нормирования); для первого самца: , для последней самки .
Что же дают нам эти первые результаты? Значения главных компонент, новых признаков, обозначает одно общее направление изменчивости, характерное для всех морфологических признаков – это увеличение размеров тела с возрастом. Ход графика первой корреляционной компоненты (КК1) в общих чертах совпадает с ходом графика изменения массы (W) и длины (Lt) тела; эта компонента‚ по существу, подменяет собой два исходных признака, ее можно назвать общим термином "размеры особи". Факторные нагрузки (табл. 9.6) для этих двух признаков велики и положительны. Третий же признак дает отрицательный вклад в первую компоненту, отделяя себя от прочих. Есть все основания считать, что он характерен для какого-то иного направления изменчивости. (В нашем примере – это половые отличия: у самок хвосты короче.) Таким образом, на первом этапе удалось выделить одно направление изменчивости и наметить другое. Конкретизируем его с помощью второй главной компоненты.
Рис. 9.6. Корреляционные компоненты
Откуда же взять значения факторных нагрузок во второй и следующих компонентах? Ведь они должны быть другими, поскольку, по определению, следующие компоненты должных характеризовать другие направления изменчивости вариант, другие факторы! Здесь компонентный анализ идет по пути расчета частных коэффициентов корреляции. Общий коэффициент корреляции отражает сопряженное варьирование признаков только относительно самого сильного общего фактора, тогда как эффекты действия более слабых факторов (иных направлений изменчивости) затушевываются. Чтобы выявить оставшиеся направления изменчивости, нужно удалить эффект главного фактора! Для этого из всех значений вариант следует, условно говоря, "вычесть" долю, обусловленную этим самым сильным фактором. Для нашего примера попробуем поступить грубо и от значений исходных признаков непосредственно вычтем значение первой главной компоненты: . Оставшаяся часть значения каждого признака будет отражать действие всех прочих причин, кроме первой. Если теперь рассчитать корреляцию для вариант, "очищенных" от влияния первого фактора, то корреляция между признаками должна показать их сопряженное изменение относительно другого, второго по силе фактора. Понятно, что корреляционная структура "очищенной" матрицы данных будет совершенно другой, нежели у исходной: все зависимости оказались высокими и положительными (r > +0.9) (табл. 9.8). Для расчета значений второй компоненты в качестве факторных нагрузок возьмем коэффициенты корреляции с опорой на признак (Lc – KK1) (табл. 9.8). Эти новые коэффициенты корреляции сыграют роль факторных нагрузок для уравнения второй корреляционной компоненты: ; расчеты значений этой компоненты для конкретных особей приведены в табл. 9.7. Таблица 9.8 Матрица корреляций W – KK1 Lt – KK1 Lc – KK1 W – KK1 1.00 0.822 0.976 Lt – KK1 0.822 1.00 0.923 Lc – KK1 0.976 0.923 1.00
Судя по графику хода второй компоненты (рис. 9.5), она в первую очередь "пытается" отследить и усилить второе направление изменчивости данных – отличие самцов (особи № 1–8) и самок (особи № 9–17) по длине хвоста: у самок хвост короче, чем у самцов. Как показывают факторные нагрузки, признаку "длина хвоста" (1.00) в этом помогают переменные "масса" (0.976) и "длина тела" (0.923). Итак, вторая компонента обозначила другой внутренний фактор отличия особей, изменчивость по длине хвоста, половой диморфизм.
Ви переглядаєте статтю (реферат): «Расчет корреляционных компонент» з дисципліни «Введення в кількісну біологію»