По части никогда не удается полностью охарактеризовать целое, всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторую большую или меньшую ошибку. Такие ошибки, представляющие собой ошибки обобщения, экстраполяции, связанные с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, называются ошибками репрезентативности (репрезентативность – степень соответствия выборочных показателей генеральным параметрам). Отличия значений выборочных параметров от генеральных называются ошибкой репрезентативности данного параметра, или просто (статистической) ошибкой. Проиллюстрируем это примером. Из лабораторной культуры взяли 8 выборок по 10 одновозрастных дафний. У каждой из них промеряли длину тела. По каждой группе получены следующие средние значения (M): M1 = 4.09, M2 = 3.85, M3 = 3.88, M4 = 3.94, M5 = 3.86, M6 = 3.89, M7 = 3.97, M8 = 3.90 мм. Общая средняя Mобщ. = 3.92 мм. Несмотря на то, что измерялись особи из одной культуры (одинаковые для всех генотипы и условия содержания), получены разные средние величины. Эти отличия и есть ошибки репрезентативности, связанные с неточностью оценок по небольшим выборкам. Если теперь мы найдем среднеквадратичное отклонение этих отдельных средних от общей, оно будет характеризовать средний диапазон отклонения выборочных оценок от генеральных значений. В данном случае показатель изменчивости средних составляет SM = 0.078513 ≈ 0.08 мм. Эта величина называется ошибкой средней арифметической (или стандартной ошибкой) и является по существу средним квадратичным отклонением множества выборочных средних от генеральной средней. На практике обычно нет возможности делать несколько выборок и вычислять несколько выборочных средних, чтобы по ним проводить расчеты. Статистическая теория показывает, что ошибка средней в раз меньше, чем стандартное отклонение. Значит, ошибку можно рассчитать для единичной отдельной выборки по формуле: (SM обозначается как m). Используя это уравнение, были рассчитаны ошибки для разных выборок нашего примера, которые принимали значения от 0.05 до 0.11 мм, что оказалось близко к точной величине ошибки SM =0.08. Статистические ошибки служат мерой тех пределов, в которых выборочные частные оценки могут отклоняться от параметров генеральной совокупности. Как следует из конструкции расчетной формулы, величина ошибки тем больше, чем больше варьирование признака (S) и чем меньше выборка (n). При увеличении объема выборки ошибки репрезентативности стремятся к нулю (следствие закона больших чисел). Ошибку репрезентативности имеют все статистические параметры, рассчитанные по выборке: средняя, стандартное отклонение, коэффициент вариации, показатели асимметрии и эксцесса. Для разных типов распределений расчетные формулы могут немного изменяться. Для нормального распределения они имеют следующий вид. Ошибка средней: , ошибка стандартного отклонения: , ошибка коэффициента вариации: . Вычисленные значения ошибок подставляют к соответствующим параметрам со знаками плюс-минус (параметр ±ошибка) и в такой форме представляют в научных отчетах и публикациях. Вернемся к примеру с весом тела бурозубок и определим соответствующие ошибки средней арифметической: , M = 9.3±0.11 г; стандартного отклонения: , S = 0.89±0.079 г; коэффициента вариации: , CV = 9.6±0.9 %. Используя понятие ошибки репрезентативности, можно показать, почему в формуле расчета выборочной оценки стандартного отклонения (см. стр. 43) используется число степеней свободы n–1 вместо объема выборки n. Выборочная дисперсия S² оценивает генеральную дисперсию σ² неточно и отличается от нее в среднем на величину ошибки m²S : σ² = S² – m²S. В то же время известно, что ошибка в n раз меньше выборочной дисперсии m²S = S²/n. Отсюда σ² = S² – S²/n = n∙S²/n – S²/n = S²∙(n–1)/n, σ² = S²∙(n–1)/n или σ²∙n = S²∙(n–1). Иными словами, выборочная дисперсия должна быть несколько больше, чем дает формула без учета ошибки, т. е. формула для ее расчета должна включать в знаменатель число степеней свободы n–1 вместо объема выборки n. Не следует путать статистическую ошибку с методическими ошибками и ошибками точности (точности измерений, анализов, подсчетов и т. д.), хотя методические погрешности и увеличивают ошибку репрезентативности, но другим путем – методические огрехи увеличивают изменчивость признака, стандартное отклонение. Чем лучше взята выборка, чем больше ее размеры, т. е. чем вернее отражает она генеральную совокупность (все явление, весь процесс в полном объеме), тем меньше статистическая ошибка и расхождение между значениями признаков в выборочной и генеральной совокупностях. При всей неизбежности статистической ошибки она может быть сведена к минимуму отбором достаточного числа особей (вариант). С ростом объема выборки оценки параметров стабилизируются, а их ошибки репрезентативности уменьшаются.
Ви переглядаєте статтю (реферат): «Ошибка репрезентативности выборочных параметров» з дисципліни «Введення в кількісну біологію»