По сравнению с другими показателями вариации дисперсия имеет ряд преимуществ. Главное преимущество получило название закона (правила) сложения дисперсий. Мы уже неоднократно говорили о том, что даже в качественно однородных массовых явлениях в развитии отдельных групп единиц проявляется своеобразие. Поэтому применяется метод группировки к изучаемой совокупности. Итак: по всей совокупности мы можем рассчитать общую среднюю для всей совокупности; по отдельным группам соответственно можно рассчитать групповые или частные средние. Тогда можно вычислить три показателя дисперсии: общую дисперсию; среднюю из внутригрупповых дисперсий; дисперсию групповых средних (или межгрупповую дисперсию). Величина общей дисперсии ( ) характеризует вариацию признака под влиянием всех условий, вызывающих эту вариацию. Общая дисперсия, как познакомились выше, вычисляется по формуле
.
Изменчивость индивидуальных значений (вариант) признака внутри групп происходит под влиянием других, не учитываемых факторов и не зависит от признака – фактора, положенного в основу группировки. Внутригрупповая дисперсия определяется как взвешенная средняя из дисперсий по отдельным группам, т.е. по формуле
.
Межгрупповая дисперсия (дисперсия средних) отражает различия в величине изучаемого признака в “чистом виде”, т.к. влияние других факторов, специфических для каждой группы, невилированы в групповых средних и определяется по формуле
Рассмотрим пример. Имеются данные о производительности труда в двух группах рабочих, прошедших и не прошедших техническое обучение.
Часовая выработка (в штуках), В Рабочие, прошедшие техническое обучение Рабочие, не прошедшие техническое обучение Всего 1 - 1 1 2 - 3 3 3 - 4 4 4 4 3 7 5 2 1 3 6 2 - 2 Всего 8 12 20
Определим величину общей дисперсии: . Определим величины групповых дисперсий и среднюю их значений: а) по рабочим, прошедшим техническое обучение: B 4 4 -0,75 0,5625 2,250 5 2 0,25 0,0625 0,125 6 2 1,125 1,5625 3,125 Всего 8 - - 5,500
= 4,75 шт.; б) по рабочим, не прошедшим техническое обучение:
Группы рабочих Число рабочих по группе Средняя часовая выработка 1 рабочего прошедшие техническое обучение 8 4,75 1,05 1,1025 8,82 не прошедшие техническое обучение 12 3,00 -0,7 0,4900 5,88 Всего 20 - - 14,7 Отсюда . Нетрудно заметить на этом примере, что указанные дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме величин межгрупповой дисперсии (дисперсии групповых средних) и средней из внутригрупповых дисперсий, т.е.
.
В нашем примере 1,71=0,975+0,735 Это тождество получило название закона (правила) сложения дисперсий. Опираясь на это правило можно определить, которая часть общей дисперсии формируется под влиянием изучаемого фактора, положенного в основу группировки (отражает так называемую систематическую вариацию) и какая часть – за счет неучтенных факторов. Средняя из групповых дисперсий ( ) дает обобщенную характеристику случайной вариации изучаемого признака, возникающего под влиянием неучтенных факторов. Теоретический и практический интерес правила сложения дисперсий заключается в следующем: зная две дисперсии можно всегда определить третий вид дисперсии; зная дисперсию групповых средних (межгрупповую дисперсию) и общую дисперсию можно судить о силе влияния группировочного признака на изучаемое явление. Например, изучаем влияние на общую урожайность внесения удобрений. Очевидно, чем ближе будет дисперсия групповых средних (когда все земельные участки сгруппированы на удобренные и неудобренные) к общей дисперсии, тем больше будет влияние внесения удобрений на общую урожайность. В математической статистике для оценки тесноты связи с использованием этого правила обоснована формула корреляционного отношения:
, где .
Ви переглядаєте статтю (реферат): «Сложение дисперсий изучаемого признака» з дисципліни «Статистика»