Стандартное отклонение (и другие показатели изменчивости)
Среднее квадратичное отклонение (или стандартное отклонение, S) – вторая по значению константа вариационного ряда. Она является мерой разнообразия входящих в группу объектов и показывает, на сколько в среднем отклоняются варианты от средней арифметической изучаемой совокупности. Продолжим рассмотрение физической аналогии, предложенной для средней. Разрежем вырезанное из картонки нормальное распределение по вертикальной линии строго пополам, начиная с точки средней арифметической. Стандартное отклонение для признака с нормальным распределением – это та точка половинки вырезанной из картонки фигуры распределения, опираясь на которую левая и правая несимметричные части уравновешивают друг друга.
Стандартное отклонение есть мера изменчивости признаков, обусловленная влиянием на них случайных факторов. Что такое "случайное" при детальном рассмотрении? В формуле модели вариант случайный компонент предстает в виде некой "добавки" к доле варианты, сформированной под действием систематических факторов, ± xслуч.. Она, в свою очередь, складывается из эффектов влияния неопределенно большого числа факторов: xслуч. = Σ xслуч.j. Каждый из этих факторов может обнаружить свое сильное действие (дать большой вклад), а может почти не участвовать в становлении варианты (слабое действие, незначительный вклад). По этой причине доля случайной "прибавки" для каждой варианты оказывается различной! Рассматривая с большим пристрастием какие-либо характеристики животных, например размеры дафний, можно увидеть, что одна особь крупнее, другая мельче, поскольку одна родилась на несколько часов раньше, другая позже, или одна генетически не вполне идентична прочим, а третья росла в более прогреваемой зоне аквариума и т. д. Если эти частные факторы не входят в число контролируемых при сборе вариант, то они, индивидуально проявляясь в разной степени, обеспечивают случайное варьирование вариант. Чем больше случайных факторов, чем они сильнее, тем дальше будут разбросаны варианты вокруг средней, и тем большим оказывается характеристика варьирования, среднее квадратичное отклонение. Подчеркнем еще раз, что в контексте нашей книге термин "случайное" есть синоним слова "неизвестное", "неподконтрольное". Пока мы каким-либо способом не выразим интенсивность фактора (группировкой, градацией, числом), до тех пор он останется фактором, вызывающим случайную изменчивость. Рассмотрим путь получения числовой характеристики изменчивости. Исходя из общей модели варианты xi = M ± xri, доля случайной изменчивости составит xri = xi – M. Простое обобщение (суммирование) эффектов действия случайных факторов для всей выборки невозможно (Σ(±xri) = 0), поэтому разность возводят в квадрат и затем извлекают из нее корень: . Отнеся полученное значение к объему выборки, получаем среднюю долю значения варианты, сформированной под действием всех случайных факторов: . Эта формула могла бы служить для вычисления характеристики случайного варьирования, однако, как показано в математической статистике, она дает смещенные оценки, и более правильно применять другую формулу, использующую вместо объема выборки n число степеней свободы n–1. Итак, величина стандартного отклонения выражается следующей смысловой формулой: , где x – значение признака у каждого объекта в группе; М – средняя арифметическая признака; п – число вариант выборки.
Общая же рабочая формула расчета точного значения стандартного отклонения (заложенная и в алгоритм приведенной программы для ЭВМ) имеет следующий вид: , где Σx² – сумма квадратов значений признака для всех вариант, Σx – сумма значений признака, n – объем выборки. В среде Excel стандартное отклонение вычисляется с помощью функции =СТАНДОТКЛОН(диапазон). Для примера с массой тела бурозубок стандартное отклонение будет равно: С4 =СТАНДОТКЛОН(A2:A64), т. е. S = 0.897216496; после необходимого округления S = 0.897 г. В некоторых случаях бывает необходимо определить взвешенное среднее квадратичное отклонение для суммарного распределения, составленного из нескольких выборок, для которых значения стандартных отклонений уже известны. Эта задача решается с помощью формулы: , где SΣ – усредненная величина среднего квадратичного отклонения для суммарного распределения; S – усредняемые значения стандартного отклонения; п – объемы отдельных выборок; k – число усредняемых стандартных отклонений. Рассмотрим такой пример. Четыре независимых определения веса печени (мг) у землероек-бурозубок в июне, июле, августе и сентябре дали следующие величины стандартных отклонений: 93, 83, 50, 71 (при n = 17, 115, 132, 140). Подставив в вышеприведенную формулу нужные значения, получим стандартные отклонения для суммарной выборки (для всего бесснежного периода): = 69.9.
В случае, если требуется первичная статистическая обработка большого числа выборок, но необязательно с большой точностью, для оценки стандартного отклонения можно воспользоваться экспресс-методом, основанным на знании закона нормального распределения. Как уже отмечалось, крайние значения для выборки (с вероятностью P = 95%) можно считать границами, удаленными от средней на расстояние 2S: xmin = M–2S, xmax = M+2S. Это значит, что в лимите (Lim), в диапазоне от максимального до минимального выборочного значения, укладываются четыре стандартных отклонения: Lim = (M+2S) – (M–2S) = 4S. Однако этот вывод справедлив только по отношению к выборкам большого размера, тогда как для небольших выборок необходимо делать поправки. Рекомендуется следующая формула приблизительного расчета стандартного отклонения (Ашмарин и др., 1975): , где величина d взята из таблицы 2.3 (против соответствующего объема выборки, n).
Таблица 2.3 п d п d п d n d 2 1.128 7 2.704 12 3.258 17 3.588 3 1.693 8 2.847 13 3.336 18 3.640 4 2.059 9 2.970 14 3.407 19 3.689 5 2.326 10 3.079 15 3.472 20 3.735 6 2.534 11 3.173 16 3.532 более 4
Выборочное стандартное отклонение веса тела бурозубок (n = 63), рассчитанное по приведенной формуле, составляет: S = (11.9–7.3)/4 = 1.15 г, что достаточно близко к точному значению, S = 0.89 г. Использование экспресс-оценок стандартного отклонения значительно сокращает время расчетов, существенно не сказываясь на их точности. Отмечается лишь небольшая тенденция к завышению получаемых этим методом значений стандартного отклонения при небольших объемах выборок. Стандартное отклонение – величина именованная, поэтому с ее помощью можно сравнивать характер варьирования лишь одних и тех же признаков. Чтобы сопоставить изменчивость разнородных признаков, выраженных в различных единицах измерения, а также нивелировать влияние масштаба измерений, используют так называемый коэффициент вариации (СV), безразмерную величину, отношение выборочной оценки S к собственной средней M: .
В нашем примере с весом тела бурозубок 9.6 %. Индивидуальная изменчивость (варьирование) признаков – одна из наиболее емких характеристик биологической популяции, любого биологического процесса или явления. В связи с этим особенно важно правильно оценивать степень варьирования показателей, что представляется отнюдь не простой задачей, особенно в свете дискуссий о способах измерения и изучения изменчивости. Не затрагивая чисто методических аспектов проблемы и оставляя последнее слово за специалистами-математиками, следует, тем не менее, согласиться с мнением о том, что коэффициент вариации может считаться вполне адекватным и объективным критерием, хорошо отражающим фактическое разнообразие совокупности независимо от абсолютной величины признака. Индекс был создан для унификации показателей изменчивости разных или разноразмерных признаков путем приведения их к одному масштабу. Отнесением квадратичных отклонений к соответствующим средним мы переводим их в соизмеримые показатели и тем самым освобождаем от влияния величины самого признака. Практика показывает, что для многих биологических признаков наблюдается увеличение изменчивости (стандартного отклонения) с ростом их величины (средней арифметической). При этом коэффициент вариации остается примерно на одном и том же уровне 8–15%. За увеличение коэффициента вариации ответственны, как правило, растущие отличия распределения признака от нормального закона.
Ви переглядаєте статтю (реферат): «Стандартное отклонение (и другие показатели изменчивости)» з дисципліни «Введення в кількісну біологію»