В основе однофакторного дисперсионного анализа (дословно – разложение дисперсий) лежит модель варианты (xi), которая выражает ее отклонение от общей средней (M) за счет действия контролируемого фактора (xфакт.) и действия случайных причин (xслуч.): xi = M ±xфакт. ±xслуч. Иными словами, отклонение варианты от общей средней связано с отклонением за счет действия изучаемого фактора и за счет действия прочих неучтенных факторов. Каждой дозе изучаемого фактора соответствует одна выборка (градация). Поэтому каждая групповая (выборочная) средняя будет характеризовать реакцию объектов на соответствующую дозу изучаемого фактора и эффект изучаемого фактора можно выразить как отклонение групповой средней – от общей средней: xфакт. = Mj – M. В свою очередь, от групповой средней каждая варианта будет отличаться в силу случайных неучтенных причин, эффект действия случайных факторов можно выразить как отклонение отдельной варианты от данной групповой средней: xслуч. = xi – Mj. Получается, что отклонение варианты от общей средней будет равно отклонению групповой средней от общей средней (эффект учтенного фактора) и отклонению варианты от своей групповой средней (эффект неучтенных факторов). Отсюда: (xi – M) = (Mj – M) + ( xi – Mj). Обобщая эту запись для всех вариант выборки (возведя в квадрат и суммировав), получаем правило разложения общей вариации признака на составные части, отражающие влияние всех названных причин: Собщ. = Сфакт. + Сслуч. Общая сумма квадратов признака рассчитывается как сумма квадратов отклонений всех вариант (xi) от общей средней (M): Собщ. = Σ (xi – M)². Факториальная сумма квадратов рассчитывается как сумма квадратов отклонений частных средних (Mi) для каждой выборки (всего k выборок) от общей средней: Сфакт. = Σ (Mj – M)². Остаточная (случайная) сумма квадратов есть сумма квадратов отклонений вариант каждой выборки (xi) от своей средней (Mj): Сслуч. = Σ (xi – Mj)². Параметры дисперсионного анализа и порядок их вычислений представлены в таблице 7.2. Отношение сумм квадратов (SS, sum of squares) к соответствующему числу степеней свободы дает оценку величины дисперсии, или средний квадрат (MS, mean square), иногда ее именуют варианса. Влияние изучаемого фактора отражает факториальная, или межгрупповая, дисперсия S²факт., а влияние случайных неорганизованных в данном исследовании причин – случайная, или внутригрупповая, остаточная дисперсия S²случ., или S²остат. Таблица 7.2 Состав-ляющие дисперсии Суммы квадратов (SS), С Сила влияния, η² Степени свободы, df Дисперсии (средний квадрат, MS), S² Критерий влияния, F Фактори-альная Сфакт. = Σ (Mj – M)² k–1 S² факт. = = F = Случайная Сслуч. = Σ (xi – Mj)² n–k S²случ. = = Общая дисперсия Собщ. = Σ (xi – M)²
Сила влияния фактора определяется как доля частной суммы квадратов в общем варьировании признака. Показатель силы влияния изучаемого фактора составляет: η² факт. = Сфакт./ Собщ., неорганизованных (случайных): η² случ. = Сслуч./ Собщ.; сумма этих показателей, естественно, равна единице: η² факт.+ η² случ. = 1. В то же время нам кажется, что придавать большое значение этому индексу не стоит. Во-первых, в литературе показано, что он дает не точную характеристику вклада фактора в общую изменчивость и для него приходится рассчитывать некую поправку. Во-вторых, утверждение вроде "фактор влияет с силой 20%" ничего не передает, кроме впечатления о не очень большом влиянии фактора. Гораздо интереснее было бы дать прогноз возможных значений результативного признака при том или ином уровне действия фактора, а это можно сделать только с помощью регрессионного анализа или имитационного моделирования. По этим причинам мы рекомендуем рассматривать показатель η факт. как простую и удобную характеристику влияния фактора на признак, подталкивающую исследователя к решению о необходимости продолжения биометрического исследования в рамках регрессионного анализа. Чем большую долю в общей дисперсии занимает ее факториальная часть, тем большая часть общего разнообразия обусловлена варьированием за счет действия фактора. Нулевая гипотеза гласит: "влияние фактора на признак отсутствует". Проверяют гипотезу по критерию Фишера: F = S² факт./ S²случ. ≥ F (α, df1, df2), где df1 = k–1, df2 = n–k, k – число градаций результативного признака, n – общий объем всех выборок по всем градациям. Влияние считается достоверным, если величина расчетного критерия равна или превышает свое табличное значение с принятым уровнем значимости (обычно α = 0.05) (F определяется по табл. 7П).
Ви переглядаєте статтю (реферат): «Техника расчетов» з дисципліни «Введення в кількісну біологію»