Одной из важнейших обобщающих характеристик вариационного ряда является средняя величина признака (часто обозначается буквой М). Существует несколько видов средних (средняя арифметическая – простая и взвешенная, средняя гармоническая, средняя квадратичная), но в практике биологических исследований наибольшее значение имеет средняя арифметическая, величина, вокруг которой "концентрируются" варианты. Физической аналогией может послужить такой образ средней арифметической для признака с нормальным распределением: средняя – это та точка вырезанного из картонки распределения, опираясь на которую левая и правая симметричные половинки уравновешивают друг друга. Общая формула для определения величины средней арифметической – это отношение суммы значений всех вариант (xi) выборки к их числу (объему выборки, n): . Средняя арифметическая характеризует действие систематических факторов, дающих равный вклад в каждую варианту выборки, исходя из рассмотренной модели: xi = xdi ± xri.
Выполняя суммирование Σxi = Σxdi + Σ(±xri) , можно увидеть, что сумма случайных отклонений влево и вправо от средней в силу симметричности нормального распределения обращается в нуль (Σ(±xri) = 0). Значит, сумма вариант есть сумма эффектов действия только доминирующего фактора, одинакового для всех вариант (Σxi = Σxdi). Средняя арифметическая есть поэтому характеристика действия доминирующего фактора на одну варианту: M = Σxi /n = Σxdi/n. Модель варианты преобразуется: xi = M ± xri. В среде Excel значение средней арифметической вычисляет функция =СРЗНАЧ(диапазон). Диапазоном может быть как один столбец, так и несколько. Для нашего примера с бурозубками средний вес составит С3 =СРЗНАЧ(A2:A64), M = 9.298412698. При расчетах статистических параметров следует помнить, что большое количество значащих цифр, рассчитанных ЭВМ, обычно не имеет никакого биологического смысла. Записывая такие статистические параметры, как средняя и стандартное отклонение, следует оставлять в лучшем случае на одну значащую цифру больше, чем имели значения вариант, а оценки ошибок – на две значащих цифры. Поскольку масса тела бурозубок колебалась от 7.3 до 11.9 г, средняя с учетом округления должна иметь вид M = 9.3 г. В биологических исследованиях зачастую встречается ситуация, когда требуется первичная статистическая обработка большого числа выборок, но необязательно с большой точностью. Это может понадобиться для предварительного рассмотрения и оценки материала, в частности для оперативного выявления общих тенденций его изменчивости, с тем, чтобы в дальнейшем перейти к специальным методам статистического анализа. Таковы, например, параметры многочисленных почвенных проб, результаты лабораторных анализов, морфологические характеристики разных групп животных, органов растений, физиолого-биохимические показатели и др. В этих случаях вычисление средней арифметической по предложенной формуле неоправданно из-за большой трудоемкости и неадекватной задачам исследования избыточной точности. Между тем знание закона нормального распределения позволяет предложить простой экспресс-метод расчета средней арифметической с использованием полученного для данной выборки размаха значений (Lim). В случае нормального распределения средняя арифметическая находится точно по центру (совпадает со значением медианы), т. е. левая и правая границы распределения (с любой принятой вероятностью) находятся на одинаковом расстоянии от средней. В выборке объемом n>30 крайние значения удалены от средней на расстояние 2S (с вероятностью P = 95%): xmin = M–2S, xmax = M+2S, и среднюю арифметическую можно рассчитать по формуле медианы:
Для бурозубок эта средняя составит M = (7.3+11.9)/2 = 9.6 г, что вполне соответствует действительности. В случаях, когда необходимо объединить результаты расчетов по нескольким выборкам и на этой основе найти общую среднюю, характеризующую весь изученный материал, пользуются взвешенной средней, которая учитывает объемы частных выборок: , где Mj – значение частной средней, nj – условные "веса" частного значения, объемы выборок. Чтобы рассчитать среднюю взвешенную, необходимо значение средней арифметической помножить на его "вес", все эти произведения сложить и сумму разделить на сумму весов. Пусть получены результаты определения средней величины выводка у рыжих полевок (экз./ самку) по месяцам: май 5.0, июнь 5.4, июль 6.2, август 6.0, сентябрь 4.5, причем известно число определений (самок) для каждого месяца: 22, 43, 103, 33 и 5. Средняя взвешенная составит: M = (5∙22+5.4∙43+6.2∙103+6∙33+4.5∙5)/ (22+43+ 103+33+5) = 5.8. Вычисление общей средней арифметической обычным способом дает в этом случае заниженную характеристику: М = (5+5.4+6.2+6+4.5)/5 = 5.4. Помимо средней арифметической важную область применения находит и средняя квадратичная. Ее употребляют при вычислении средних площадей, диаметров, радиусов, например, при расчете среднего размера клеток микроскопических водорослей, диаметра эритроцитов, величины листовой пластинки у растений, размеров колоний микробов и т. д. Средняя квадратичная равняется корню квадратному из суммы квадратов вариант, отнесенной к их общему числу, и рассчитывается по формуле:
Применение этой величины оправдано тем, что указанные признаки имеют несимметричное нормальное распределение, но обладают резко выраженной асимметрией. Возведение в квадрат сильнее сказывается на больших значениях, по сравнению с меньшими, частоты больших значений повышаются, распределение становится более симметричным, близким к нормальному, а средняя арифметическая для квадратов делит распределение пополам. Поэтому средние квадратичные обладают свойствами полноценных средних, тогда как простые средние арифметические, рассчитанные по таким данным, дают смещенные оценки. Если, например, отдельные измерения диаметра эритроцитов дали следующие результаты: 7, 8, 10, 8, 11 и 6 мкм, то средний диаметр, найденный как среднее квадратичное, будет: , тогда как простая средняя арифметическая дает величину 8.3. В число прочих констант вариационного ряда входит медиана (Me), значение, делящее размах выборки пополам, и мода (Mo), класс (или значение), представленный наибольшим числом вариант.
Ви переглядаєте статтю (реферат): «Средняя (характеристика величины признака)» з дисципліни «Введення в кількісну біологію»