Зачем же делать такую подмену одних признаков – другими? Дело в том, что новые показатели – это не совсем "признаки", характеристики объектов. С бóльшим основанием их можно назвать "явлениями"; это отображения неких процессов (или факторов), затрагивающих сразу группы признаков объектов измерения. Взять, к примеру, индивидуальный рост животных, который сказывается и на размерах тела, и на массе особи, ее внутренних органов, степени развития генеративных органов, интенсивности обменных процессов и т. д. Опыт показывает, что в выборке разновозрастных животных одна из главных компонент формируется при участии всех этих признаков и поэтому может быть названа "возрастные изменения", т. е. как явление, а не признак. Что же могут представлять из себя другие главные компоненты, какие явления она могут описывать, какое общее направление изменчивости? Таким направлением может быть, например, половой диморфизм по многим признакам: самки отличаются от самцов и массой, и размерами, и пропорциями, и степенью гипертрофии органов при беременности и т. д. Это вторая причина изменчивости затрагивает те же признаки, что и онтогенез, но "в другом направлении". Наконец, если рост и развитие разных особей проходили в разных условиях (разные сезоны, районы ареала, антропогенной пресс), они не могли не сказаться на морфологии, но своим, особенным образом – третья причина. Эта логика приводит нас к двойственному заключению: каждый реальный признак характеризует только какую-то одну сторону явлений, которыми захвачены особи, каждое из этих явлений (факторов) сказывается на многих признаках. Получается, что в значении каждой отдельной варианты воплощается реализация нескольких разнородных процессов; модель значения варианты любого исходного признака имеет вид: , где x – исходное значение какого-либо признака x, xa – выражение процесса a в формировании варианты x, xb – роль процесса b в формировании значения варианты x. Понятно, что разные факторы будут оказывать на варианты разное влияние, одни более сильное, другие более слабое. Например, из рассмотренных выше возможных отличий вариант, воплощенных в конечном признаке каждой особи (пусть это будет масса тела), наибольшую роль сыграет возраст, а также половой диморфизм, затем условия развития, индивидуальные отличия и пр., т. е. a > b > c >… Если попытаться выразить массу какого-либо мелкого животного (например, обыкновенной гадюки) предложенным способом, получим: , где Wi – значение массы отдельной i-й особи, Wвид – вклад в значение массы видовой нормы (средней)(примерно 50 г), Wпол – вклад в значение массы половых отличий (±50 г), Wвозраст – вклад в значение массы этапа онтогенеза (±80 г), Wплод – вклад в значение массы наличие эмбрионов (±60 г), Wсезон – вклад в значение массы сезона (упитанности, развития)(отличия до 50 г). Так, для молодого половозрелого самца гадюки летом имеем примерно W = 50 + 40 – 20 + 0 + 0 = 70 г,
для старой беременной самки летом W = 50 + 100 + 100 + 30 – 20 = 260 г, для трехлетней ювенальной особи весной W = 50 + 0 – 30 + 0 + 0 = 20 г. Пример показывает, благодаря действию каких причин отличаются размеры животных, какие направления изменчивости реализованы в этих вариантах; в порядке возрастания значимости это: отличия по возрасту, отличия по полу, отличия по участию в размножении, отличия по сезону (упитанности). Важно указать, что "видовая норма", определенная комплексом процессов, определяющих типичные для вида размерные характеристики (условная средняя), дает одинаковый вклад во все значения вариант; вклады остальных причин для каждой особи различны. Аналогичным образом можно расписать влияние названных причин на любой другой признак, например, на линейные размеры тех же гадюк: и т. п.
Итак, одни и те же процессы (факторы) сказываются на разных количественных характеристиках изучаемых объектов, при этом на разные варианты один и тот же фактор воздействует с разной силой. Сила действия данного фактора может быть, видимо, определена по величине соответствующей "добавки" к значению варианты. Такой "декомпозирующий" взгляд на числа в матрице исходных данных позволяет предложить принцип поиска и количественной характеристики общих причин, ответственных за отличия объектов выборки. Используя информацию, заключенную в исходной матрице данных, в рамках компонентного анализа предлагается количественно выразить факторы, ответственные за отличия объектов. Данный l-й фактор можно представить как сумму всех эффектов (xlj) его воздействия во все изучаемые признаки (x1,…xj,…xm), т. е. как сумму всех "добавок" данного фактора во все значения отдельных признаков отдельной особи:
… (x1 как сумма вкладов разных факторов в первый признак) …,
(xm как сумма вкладов разных факторов) в m-й признак)
– сумма вкладов одного фактора в значения всех признаков, где ГКа – значение главной компоненты, характеризующей действие одного из процессов формирования вариант (фактор a), xaj – вклад фактора a в значение варианты j-го признака данного объекта. Для другого процесса (фактор b) имеем:
и т. д. для всех прочих факторов. Например, как показывает практика, первой главной компонентой в выборке животных обычно оказывается фактор возрастных отличий, что позволяет записать примерное выражение: . Иными словами, главная компонента, характеризующая действие возраста, представляет собой сумму соответствующих долей вариант по всем признакам. Конечно, странно и неправильно было бы складывать граммы с миллиметрами и миллиграммами, поэтому в уравнении присутствует префикс норм., говорящий о том, что в расчетах принимают участие значения, предварительно преобразованные к виду, позволяющему проводить такие операции. Эти значения центрированы (к средней) и нормированы (на стандартное отклонение): норм. xji = , где норм. xji, или zji – нормированное i-е значение j-го признака, Mj, Sj – средняя и стандартное отклонение j-го признака по всей выборке, i – индекс объекта, особи, j – индекс признака. После нормирования признаки утрачивают единицы измерения, и складывать их значения вполне допустимо.
Ви переглядаєте статтю (реферат): «Главные компоненты как факторы» з дисципліни «Введення в кількісну біологію»