При конкретных биологических наблюдениях параметры генеральной совокупности остаются неизвестными, о них судят по выборочным оценкам, используя для этого величину ошибок репрезентативности. Границы, в которых с той или иной вероятностью находится параметр генеральной совокупности, называются доверительными, а интервал, заключенный между этими границами, – доверительным интервалом. Теоретические исследования поведения выборочных средних (как случайных величин) показали, что они подчиняются нормальному закону, большинство из них (95%) находится поблизости от генеральной средней – в диапазоне Mген.±1.96∙m. Это обстоятельство позволяет делать обратное заключение – генеральная средняя находится в диапазоне Mвыбор.±1.96∙m, т. е. предсказывать ширину интервала, в котором находится генеральный параметр, давать интервальную оценку генеральному параметру. В соответствии с законом нормального распределения можно ожидать, что генеральный параметр (истинное значение) окажется в интервале от М–T∙m до М+T∙m, где m – ошибка средней арифметической, T – квантиль распределения Стьюдента (табл. 6П) при данном числе степеней свободы (df) и уровне значимости (обычно α = 0.05). Сказанное можно перефразировать так: с вероятностью P = 0.95 можно ожидать, что генеральная средняя находится в доверительном интервале М±T∙m, построенном вокруг выборочной средней арифметической M.
Возвращаясь к примеру о весе землероек-бурозубок, мы теперь можем записать доверительные интервалы при разных уровнях вероятности (граничные значения T взяты для случая n = ∞): Для Р = 0.95 М±T∙т = 9.3±1.96∙0.11 = 9.3±0.21 г; Для Р = 0.99 М±T∙т = 9.3±2.58∙0.11 = 9.3±0.28 г; Для Р = 0.999 М±T∙т = 9.3±3.30∙0.11 = 9.3±0.36 г. Таким образом, искомая генеральная средняя величина веса землероек с вероятностью P = 95% находится в пределах 9.11–9.53 г, с вероятностью P = 99% – 9.04-9.6, для P = 99.9% – 8.96–9.68 г. Если объем выборки, для которой были получены параметры и вычислялась ошибка репрезентативности m, был невелик (n<500), то необходимо вводить поправки на объем выборки, расширяя область возможного пребывания генерального параметра. Это понятно, поскольку при дефиците информации любые заключения не могут быть очень точными. Рассчитаем доверительный интервал для тех же данных, но с объемом n = 20 экз. Ошибка средней арифметической составит г, M = 9.3±0.2 г. При уровне значимости α = 0.05 и числе степеней свободы df = n–1 = 20–1 = 19 табличная величина статистики Стьюдента равна T = 2.09, тогда доверительный интервал составит: М±T∙т = 9.3±2.09∙0.2 = 9.3±0.41 г – от 8.9 до 9.7 г. Аналогичным образом можно построить доверительный интервал для стандартного отклонения (S±TmS), коэффициента вариации(CV±TmCV), а также других статистических параметров (коэффициентов асимметрии, эксцесса, регрессии, корреляции), рассмотренных в следующих разделах.
Ви переглядаєте статтю (реферат): «Доверительный интервал» з дисципліни «Введення в кількісну біологію»