Расхождения между характеристиками выборочной и генеральной совокупности принято называть ошибкой выборки. В математической статистике доказывается, что значение усредненной ошибки выборки ( ) определяется по формуле
,
где - генеральная дисперсия; - объем выборки. В этой формуле, как видно из записи, предполагается, что генеральная дисперсия известна. Но в выборочном обследовании она неизвестна. Поэтому на практике вместо используют дисперсию выборочной совокупности . Дело в том, что при соблюдении основных принципов организации и проведения выборочного наблюдения (случайного отбора, обоснования объема выборки) дисперсия достаточно большого объема выборки стремится отобразить дисперсию генеральной совокупности. При этих условиях зависимости между дисперсиями в генеральной и выборочной совокупностях выражается так:
.
Отсюда видно, что если n достаточно велико, то отношение
.
Например, при n = 100 оно равно 1,01 и при n = 500 уже имеем = 1,002 и т.д. С учетом рассмотренного расчет средней ошибки выборки можно проводить по формуле
.
Для альтернативного признака дисперсия в выборочной совокупности определяется по формуле
.
Для количественного признака соответственно используется формула
или .
Строго говоря, указанные выводы верны только для так называемого повторного отбора (см. п. 12.4 данной темы), т.е. когда каждая попавшая в выборку единица совокупности после фиксации должна быть возвращена в генеральную совокупность и ей представляется равная возможность снова попасть в выборку. Однако на практике выборочное наблюдение проводится, как правило, по схеме бесповторного отбора. Поскольку при бесповторном отборе численность генеральной совокупности N в ходе выборки сокращается, то в формулу для расчета средней выборки включается дополнительный множитель
.
С учетом полученной оценки средней ошибки выборки истинное значение характеристики генеральной совокупности определяется по формуле
.
В общем виде это записывается так:
.
Другими словами, полученные характеристики выборочной совокупности отличаются от характеристики генеральной совокупности на величину средней ошибки выборки . Следует иметь в виду, что такое утверждение можно гарантировать лишь с определенной степенью вероятности, а не с абсолютной достоверностью. В математической статистике доказывается, что эта вероятность равна 0,683. Это означает, что в 683 случаях на 1000 генеральной характеристики будут находиться в указанных выше пределах . В остальных же 317 случаях они могут выйти за эти пределы. Вероятность суждения можно повысить, если расширить пределы отклонения (если среднюю ошибку выборки увеличить в t раз). Так, при t = 2 вероятность суждения надежности достигает 0,954. А при t=3 вероятность суждения повышается до 0,997. Таким образом, показатели характеристики генеральной совокупности определяются по формуле
.
В статистике множитель t называется коэффициентом доверия. Русский математик А.М.Ляпунов (1857-1918) обосновал математическое выражение конкретных значений множителя t для различных степеней вероятности в виде функции:
.
На практике пользуются готовыми таблицами этой функции применительно к случаю нормального распределения. Например.
Выбор той или иной доверительной вероятности зависит от необходимой степени достоверности результатов выборочного наблюдения. В экономических исследованиях обычно ограничиваются значениями t, не превышающими 2-3 единиц. Если примем t=2.6, то имеем в 99 случаях из 100 характеристика генеральной совокупности будет совпадать с соответствующей выборочной характеристикой, т.е. будет находиться в пределах
.
Гарантия результатов выборочных обследований в 99 случаях из 100 практически равнозначна достоверности. Обобщим полученные выводы. Итак, по своей природе характеристики выборочной совокупности являются случайными величинами .Они могут принимать различные значения в зависимости от конкретных единиц генеральной совокупности , попавших в выборку. Однако каждый из возможных результатов выборки имеет определённую вероятность; соответственно и каждая из возможных ошибок выборки. Поэтому средняя ошибка выборки есть средняя квадратическая величина, взвешенная из отдельных ошибок вероятности их возникновения. Получили, что предельная ошибка выборки ( ) связана со средней ошибкой выборки ( ) отношением для повторной схемы отбора: .
Ви переглядаєте статтю (реферат): «Ошибка выборки» з дисципліни «Статистика»