Дисперсионный анализ позволяет установить достоверность отличия нескольких средних арифметических друг от друга, но он не сообщает, какие именно средние от каких именно средних отличаются. Может статься, например, что действие фактора вызывает более или менее плавное изменение средних без заметных переломов в этой тенденции. При этом биологический вопрос может состоять в том, чтобы определить минимальную дозу фактора, которая по сравнению с контролем значимо влияет, изменяет среднюю для этой градации, т. е. определить "первую действующую концентрацию". Казалось бы, этот вопрос относится к задаче сравнения двух выборок: контрольная выборка поочередно сравнивается с выборками, полученными для все возрастающих доз фактора, а первое достоверное отличие средних как раз и означает, что данная доза уже "действующая". Однако с точки зрения статистики такое сравнение оказывается некорректным и неточным. При таком "лобовом" попарном сравнении выборок одна из них (для градации контроля) все время участвует в этой процедуре, на основании которой формулируются разные статистические выводы о достоверности отличий средних с той или иной вероятностью. Тем самым эти выводы оказываются зависимыми друг от друга. Доверительная вероятность каждого из этих выводов, поэтому, от сравнения к сравнению уменьшается! Чем больше выводов сделано на одном и том же материале, тем меньше вероятность их справедливости. Второе негативное обстоятельство связано с тем, что такая процедура учитывает далеко не всю информацию о явлении. Действительно, изменчивость вариант комплекса выборок (в нашем примере было 14 вариант в 4 выборках) определяется как действием изучаемого фактора, так и множеством других не учитываемых, случайных, причин. При сравнении же всего двух выборок (например, выборок 1 и 4) эта случайная изменчивость представлена не всем объемом информации, но только той частью, что проявилась в рамках этих двух сравниваемых выборок (две выборки содержат лишь 7 вариант). Поэтому оценки случайной изменчивости для двух выборок оказываются не столь точными, как могли бы быть по всем градациям. Улучшить ситуацию позволяет метод попарного сравнения выборок, проводимый на базе однофакторного дисперсионного анализа (метод Шеффе). Для сравнения двух средних предлагается критерий F Фишера, в числителе которого стоит оценка действия фактора (разность средних) для любых двух сравниваемых градаций, а в знаменателе – оценка случайной изменчивости, общая для всего дисперсионного комплекса: , где M – средние арифметические для любых двух (i, j) градаций однофакторного дисперсионного комплекса, S²случ.– оценка случайной изменчивости из таблицы дисперсионного анализа, k – число градаций фактора, ni, nj – объемы выборок сравниваемых градаций, α – принятый уровень значимости (обычно α = 0.05) df – число степеней свободы df1 = k–1, df2 = (k–1)∙(n–1). Отличия средних считаются достоверными, если расчетное значение критерия Фишера превысит табличное F(α,df1,df2) (табл. 7П). Сопоставляя выборочные средние для первой и четвертой градаций нашего примера (табл. 7.3), имеем: F1,4 = (5.8–8)²/[(4–1)∙ 0.82∙(1/4+1/3)] = 3.37, df1 = 4–1 = 3; df2 = (4–1)∙(14–1) = 39, F(0.05,3,39) = 2.87. Полученное значение (3.37) больше табличного (2.87), следовательно, между средними арифметическими первой и последней градаций есть достоверное отличие; разные дозы фактора действительно вызывают изменение плодовитости дафний. Сравнение выборок первой и второй градаций показывает, что низкие дозы фактора в них не позволяют говорить о существенном влиянии на дафний: для данных объемов выборок полученное значение критерия (0.69) меньше табличного (2.87). F = (5.8–6.8)²/[(4–1)∙ 0.82∙(1/4+1/3)] = 0.69 < 2.87.
Ви переглядаєте статтю (реферат): «Парные сравнения выборочных средних методом Шеффе» з дисципліни «Введення в кількісну біологію»