Проверка гипотезы о принадлежности выделяющих единиц исследуемой генеральной совокупности
Как отмечалось в предыдущих лекциях неоднократного, изучение массовых явлений, как правило, осуществляется по неполной информации. В составе собранных данных могут встречаться единичные наблюдения, у которых отдельные значения изучаемых признаков заметно отличаются от общей тенденции изменения большинства значений. Причины таких отличий могут быть разными: из-за ошибок наблюдения; вследствие случайного стечения различных обстоятельств, каждый из которых в отдельности несущественный, но совокупное их влияние привело к таким резко выделяющимся от общей картины значениям признаков; как следствие нарушения однородности изучаемой совокупности. В общем случае все значения изучаемых признаков фиксируются по известным единицам совокупности по их части, отобранной с учетом всех требований. Следовательно, первичные статистические данные, включая и резко «выделяющемся», соответствуют конкретным случаям проявления изучаемого явления. Следовательно, субъективное отбрасывание «выделяющихся» единиц недопустимо. Как отмечалось неоднократно, в экономико-статистических исследованиях в обычных условиях применяется гипотеза о нормальном характере распределения изучаемых признаков с параметрами . Пусть при проведении одного из наблюдений за данной совокупностью были получены значений , среди которых максимальное значение (или минимальное , или даже и максимальное, и минимальное) резко отличается по своей величине от остальных наблюдений (см. табл.).
Кол-во единиц совокупности Минимальные значения Максимальные значения Разность смежных значений Среднее значение Среднеквадратическое отклонение хn-хn-1
184 7 13 130 178 6 48 57,3 35,3
Возникает вопрос, относится ли (относятся ли) это (эти) значение (значения) к данной совокупности в изучаемых условиях или есть результат экстраординарных обстоятельств. Сформулируем нулевую гипотезу : значение принадлежит этой же совокупности, что и все остальные значений. Другими словами, рассматриваем гипотезу , что не является результатом ошибки наблюдения или изменения общих условий формирования уровней рассматриваемых признаков. Проверка этой гипотезы состоит в том, что сравнивается по величине с определенной критической границей возможных значений х.
Рис. 14.1 Двухсторонняя критическая область
а) область больших положительных отклонений
б) область больших отрицательных отклонений
Рис 14.2. Левосторонняя и правосторонняя критическая область
Если выделяющимся значением является , то сравнивается с верхней допустимой границей, выбранной таким образом, чтобы вероятность превзойти ее была равна уровню значимости. В данном случае будет иметь место критическая область вида (см. рис. 14.2, а):
.
Если , то гипотеза отклоняется. Если проверяется принадлежность (наименьшего значения), то надо сравнивать с нижней границей области допустимых значений , т.е. (см. рис. 14.2, б). Если же испытанию одновременно подлежат и максимальное, и минимальное значения, то критическая область будет иметь вид (см. рис. 14.1).
.
В приведенном примере минимальное значение незначительно отличается от (только на 6 единиц), тогда как (заметно больше ). Следовательно, необходимо проверить, принадлежит ли к рассматриваемой совокупности. Для больших выборочных совокупностей для этой цели используются табличные значения нормированной функции Лапласа. При уровне значимости значение нормированной функции Лапласа для рассматриваемый критической области будет равна 0,49= . Этому значению соответствует . Тогда верхняя допустимая граница значений признака, которая не может быть превышена с вероятностью 0,99 будет равна . Критерий для : . Отсюда . Значение =178 выходит за рассчитанную границу. Итак получаем в результате проверки вывод, что с вероятностью 0,99 можно утверждать, что не принадлежит к изучаемой совокупности и это значение признака следует исключить из дальнейших расчетов. При проверке данной гипотезы можно использовать по генеральной совокупности; но они обычно неизвестны. Поэтому для малых выборок t -критерий не надежен. Для проверки гипотезы о принадлежности «выделяющихся» единиц генеральной совокупности для малых выборок рекомендуется пользоваться критерием Ф. Груббса. Критерий Груббса основан на вычислении коэффициента по формуле (для испытания ) , где при и .
Для испытания наименьшего значения х1 эти расчеты будут иметь следующий вид . Расчетная величина этого отношения ( .) сравнивается с табличной величиной ( .) при определенном числе наблюдений и заданном уровне значимости. Если , то проверяемая гипотеза принимается. Если же , то значение (или ) следует из дальнейших расчетов исключить. Таким образом Ктабл характеризует ту предельную величину расхождений в суммах квадратов отклонений, которая с вероятностью может быть объяснена случайными причинами.
Пример. Отклонения деталей от номинального размера оказались такими (мм): 0,07; 0,09; 0,10; 0,12; 0,13; 0,15; 0,16; 0,17 и 0,25. Исходя из предположения о нормальном законе распределения данного признака в генеральной совокупности проверим, содержат ли эти данные ошибки наблюдения. Резко выделяется . Вычисления: и ; и . При расчете и . исключили =0,25. Отсюда отношение двух сумм квадратов отклонений будет равна ; При числе наблюдений n=9 и уровне значимости 0,01 по таблице Ф. Груббса имеем =0,2411. Следовательно, . Если бы проверку выполняли при уровне значимости 0,05 имели бы =0,3742. И в этом случае . Отсюда отклонение номинального размера 0,25мм следует отнести к ошибкам наблюдения.
Таблица Ф. Груббса (выдержка)
Число наблюдений n Уровень значимости 0,01 0,05 5 0,0442 0,1270 9 0,2411 0,3742 10 0,2831 0,4154 15 0,4401 0,5559 20 0,5393 0,6379 25 0,6071 0,6923
Имеются и другие критерии (варианты) проверки гипотезы о принадлежности выделяющихся наблюдений (единиц) генеральной совокупности (например, критерий Ирвина).
Ви переглядаєте статтю (реферат): «Проверка гипотезы о принадлежности выделяющих единиц исследуемой генеральной совокупности» з дисципліни «Статистика»