ДИПЛОМНІ КУРСОВІ РЕФЕРАТИ


ИЦ OSVITA-PLAZA

Реферати статті публікації

Пошук по сайту

 

Пошук по сайту

Головна » Реферати та статті » Статистика » Теорія статистики

Расчет моментов распределения и показателей его формы
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются центральные моменты распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 13 ) или просто моментов (нецентральные моменты в таможенной статистике практически не используются).
Таблица 13 . Центральные моменты
Порядок момента Формула
по несгруппированным данным по сгруппированным данным
Первый μ1
Второй μ2
Третий μ3
Четвертый μ4
Величина третьего момента μ3 зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами либо наоборот. При нормальном и любом другом строго симметричном распределении сумма положительных кубов строго равна сумме отрицательных кубов, поэтому на основе третьего момента строится показатель, характеризующий степень асимметричности распределения – коэффициент асимметрии (36) :
. (36 )
В нашем примере про ВО показатель асимметрии по формуле (36) составил (расчет числителя произведен в 9-м столбце табл. 12 ):
= 0,423 > 0, т.е. асимметрия значительна.
Английский статистик К.Пирсон на основе разности между средней арифметической величиной и модой предложил другой показатель асимметрии (37) :
. (37 )
В нашем примере по данным табл. 12 показатель асимметрии по формуле (37) составил: = 0,09.
Показатель асимметрии Пирсона (37) зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии (36) – от крайних значений признака. Таким образом, в нашем примере про ВО в средней части распределения наблюдается меньшая асимметрия, чем по краям, что видно и по графику (рис. 5 ). Распределения с сильной правосторонней и левосторонней асимметрией показаны на рис. 6 .

Рис. 6 . Асимметрия распределения
С помощью момента четвертого порядка характеризуется еще более сложное свойство рядов распределения – эксцесс (от англ. «излишество»). Показатель эксцесса рассчитывается по формуле (38) :
. (38 )
Чаще всего эксцесс интерпретируется как «крутизна» распределения, что не совсем верно. График распределения может выглядеть сколь угодно крутым в зависимости от силы вариации признака: чем слабее вариация, тем круче кривая распределения при данном масштабе. Не говоря уже о том, что, изменяя масштабы по осям абсцисс и ординат, любое распределение можно искусственно сделать «крутым» и «пологим». Чтобы показать, в чем состоит эксцесс распределения, и правильно его интерпретировать, нужно сравнить ряды с одинаковой силой вариации (одной и той же величиной σ) и разными показателями эксцесса. Чтобы не смешать эксцесс с асимметрией, все сравниваемые ряды должны быть симметричными. Такое сравнение изображено на рис. 7 .


Рис. 7 . Эксцесс распределения
Наличие положительного эксцесса означает наличие слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Отрицательный эксцесс означает отсутствие такого «ядра».
В нашем примере по формуле (38) эксцесс составил (расчет числителя произведен в 10-м столбце табл. 12 ): , т.е. величина ВО по таможенным постам варьирует сильнее, чем при нормальном распределении.
По значениям показателей асимметрии и эксцесса распределения можно судить о близости распределения к нормальному: показатели асимметрии и эксцесса не должны превышать своих двукратных средних квадратических отклонений, т.е. и . Эти средние квадратические отклонения вычисляются по формулам (39) и (40) :
; (39 ) . (40 )
В нашем примере по формулам (39) и (40) :
; .
Так как показатели асимметрии и эксцесса не превышают своих двукратных средних квадратических отклонений (As = |0,423| < 0,4*2; Ex = |–0,41| < 0,78*2), можно говорить о сходстве анализируемого распределения с нормальным.
3.5. Проверка соответствия ряда распределения нормальному
Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов, другими словами, теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения. Большое познавательное значение имеет сопоставление фактических кривых распределения с теоретическими.
Как уже неоднократно отмечалось, часто пользуются типом распределения, которое называется нормальным. Формула функции плотности нормального распределения имеет следующий вид (41) :
или (41 )
где X – значение изучаемого признака;
– средняя арифметическая ряда;
σ – среднее квадратическое отклонение;
– нормированное отклонение;
π = 3,1415 – постоянное число (отношение длины окружности к ее диаметру);
e = 2,7182 – основание натурального логарифма.
Следовательно, кривая нормального распределения может быть построена по двум параметрам – средней арифметической и среднему квадратическому отклонению. Поэтому важно выяснить, как эти параметры влияют на вид нормальной кривой.
Если не меняется, а изменяется только σ, то чем меньше σ, тем более вытянута вверх кривая и наоборот, чем больше σ, тем более плоской и растянутой вдоль оси абсцисс становится кривая нормального распределения (см. рис. 8 ).



Рис. 8 . Влияние величины σ на кривую нормального распределения
Если σ остается неизменной, а изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (вершины) (см. рис. 9 ).


Рис. 9 . Влияние величины на кривую нормального распределения
Итак, выделим особенности кривой нормального распределения:
кривая симметрична и имеет максимум в точке, соответствующей значению = Ме = Мо;
кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности (чем больше отдельные значения X отклоняются от , тем реже они встречаются);
кривая имеет две точки перегиба на расстоянии ± σ от ;
коэффициенты асимметрии и эксцесса равны нулю.
Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в изучаемой совокупности подчиняется какому-то определенному закону. Проверка гипотезы состоит в том, чтобы на основании сравнения фактических (эмпирических) частот с предполагаемыми (теоретическими) частотами сделать вывод о соответствии фактического распределения гипотетическому распределению.
Под гипотетическим распределением необязательно понимается нормальное распределение. Может быть выдвинута гипотеза о логнормальном, биномиальном распределениях, распределении Пуассона и пр. Причина частого обращения к нормальному распределению состоит в том, что, как уже было замечено ранее, в этом типе распределения выражается закономерность, возникающая при взаимодействии множества случайных причин, когда ни одна из не имеет преобладающего влияния.
В нашем примере про ВО близость значений средней арифметической величины (60,82), медианы (59,30) и моды (58,96) указывает на вероятное соответствие изучаемого распределения нормальному закону.
Проверка гипотезы о соответствии теоретическому распределению предполагает расчет теоретических частот этого распределения.
Для нормального распределения порядок расчета этих частот следующий:
по эмпирическим данным рассчитывают среднюю арифметическую ряда и среднее квадратическое отклонение σ;
находят нормированное (выраженное в σ) отклонение каждого эмпирического значения от средней арифметической:
; (42 )
по формуле (41) или с помощью таблиц интеграла вероятностей Лапласа находят значение φ(t) ;
вычисляют теоретические частоты m по формуле:
, (43 )
где N – объем совокупности, hi – длина (размах) i-го интервала.
Определим теоретические частоты нормального распределения в нашем примере про ВО по данным табл. 12 , для чего построим вспомогательную таблицу 14 . Средняя арифметическая величина и среднее квадратическое отклонение нами уже найдены ранее ( ); значения нормированных отклонений t рассчитаны в 5-м столбце таблицы 14 , а значения плотностей φ(t) – в 8-м столбце (в 6-м и 7-м столбцах приведены промежуточные расчеты по формуле (41) ); в последнем столбце – теоретические частоты нормального распределения.
Таблица 14 . Расчет теоретических частот нормального распределения
i Xi fi Хi’ φ(t) mi
1 24,16 – 38,66 5 31,41 -1,4889 -1,1084 0,3301 0,0067 3,383
2 38,66 – 53,16 7 45,91 -0,7549 -0,2850 0,7520 0,0152 7,707
3 53,16 – 67,66 13 60,41 -0,0210 -0,0002 0,9998 0,0202 10,246
4 67,66 – 82,16 4 74,91 0,7130 -0,2542 0,7756 0,0157 7,948
5 82,16 – 96,66 4 89,41 1,4470 -1,0468 0,3510 0,0071 3,598
6 96,66 – 111,16 2 103,91 2,1809 -2,3782 0,0927 0,0019 0,950
Итого 35

33,832
Сравним на графике эмпирические f (ВО по таможенным постам) и теоретические m (нормальное распределение) частоты, полученные на основе данных табл. 14 (рис. 10 ). Близость этих частот очевидна , но объективная оценка их соответствия может быть получена только с помощью критериев согласия.

Рис. 10 . Распределение ВО по таможенным постам (эмпирическое) и нормальное
Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда – существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.
Существует ряд критериев согласия, но чаще всего применяют критерии Пирсона χ2, Колмогорова и Романовского.
Критерий согласия Пирсона χ2 (хи-квадрат) – один из основных критериев согласия, рассчитываемый по формуле (44) :
, (44 )
где k – число интервалов;
fi – эмпирическая частота i-го интервала;
mi – теоретическая частота.
Для распределения χ2 составлены таблицы, где указано критическое значение критерия согласия χ2 для выбранного уровня значимости α и данного числа степеней свободы ν (см. Приложение 3).
Уровень значимости α – это вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность (P) того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:
α = 0,10, тогда P = 0,90;
α = 0,05, тогда P = 0,95 ;
α = 0,01, тогда P = 0,99.
Число степеней свободы ν определяется по формуле:
ν = k – z – 1, (45 )
где k – число интервалов;
z – число параметров, задающих теоретический закон распределения.
Для нормального распределения z = 2, так как нормальное распределение зависит от двух параметров – средней арифметической ( ) и среднего квадратического отклонения (σ).
Для оценки существенности расхождений расчетное значение χ2 сравнивают с табличным χ2табл. Расчетное значения критерия должно быть меньше табличного, т.е. χ2<χ2табл, в противном случае расхождения между теоретическим и эмпирическим распределением не случайны, а теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
Использование критерия χ2 рекомендуется для достаточно больших совокупностей (N>50), при этом частота каждой группы не должна быть менее 5, в противном случае повышается вероятность получения ошибочных выводов.
В нашем примере про ВО для расчета критерия χ2 построим вспомогательную таблицу 15 .
Таблица 15 . Вспомогательные расчеты критериев согласия
i Xi fi mi fi’ mi’ |fi’– mi’|
1 24,16 – 38,66 5 3,383 0,773 5 3,383 1,617
2 38,66 – 53,16 7 7,707 0,065 12 11,090 0,910
3 53,16 – 67,66 13 10,246 0,740 25 21,336 3,664
4 67,66 – 82,16 4 7,948 1,961 29 29,284 0,284
5 82,16 – 96,66 4 3,598 0,045 33 32,882 0,118
6 96,66 – 111,16 2 0,950 1,160 35 33,832 1,168
Итого 35 33,832 4,744

Теперь по формуле (44) : χ2 =4,744, что меньше табличного (Приложение 3) значения χ2табл=7,8147 при уровне значимости α = 0,05 и числе степеней свободы ν=6–2–1=3, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.
Критерий Романовского КР основан на использовании критерия Пирсона χ2, т.е. уже найденных значений χ2 и числа степеней свободы ν, рассчитывается по формуле (46) :
. (46 )
Он используется в том случае, когда отсутствует таблица значений χ2. Если КР < 3, то расхождения между теоретическим и эмпирическим распределением случайны, если КР > 3, то не случайны, и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
В нашем примере про ВО по формуле (46) : = 0,712 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.
Критерий Колмогорова λ основан на определении максимального расхождения между накопленными частотами эмпирического и теоретического распределений (D), рассчитывается по формуле (47) :
. (47 )
Рассчитав значение λ, по таблице P(λ) (см. Приложение 6) определяют вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Вероятность P(λ) может изменяться от 0 до 1. При P(λ) = 1 (т.е. при λ < 0,3) происходит полное совпадение частот, при P(λ) = 0 – полное расхождение.
В нашем примере про ВО в последних трех столбцах таблицы 15 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 3-ей группе наблюдается максимальное расхождение (разность) D = 3,664. Тогда по формуле (47) : . По таблице Приложения 6 находим значение вероятности при λ = 0,6: P = 0,86 (наиболее близкое значение к 0,619), т.е. с вероятностью, близкой к 0,86, можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, а расхождения эмпирического и теоретического распределений носят случайный характер.
Итак, подтвердив правильность выдвинутой гипотезы с помощью известных критериев согласия, можно использовать результаты распределения для практической деятельности. Какое же практическое значение может иметь произведенная проверка гипотезы? Во-первых, соответствие нормальному закону позволяет прогнозировать, какое число таможенных постов (или их доля) попадет в тот или иной интервал значений величины ВО. Во-вторых, нормальное распределение возникает при действии на вариацию изучаемого показателя множества независимых факторов. Из чего следует, что нельзя существенно снизить вариацию величины ВО, воздействуя только на один-два управляемых фактора, скажем число работников таможенного поста или степень технической оснащенности.

Ви переглядаєте статтю (реферат): «Расчет моментов распределения и показателей его формы» з дисципліни «Теорія статистики»

Заказать диплом курсовую реферат
Реферати та публікації на інші теми: Як наростити тИЦ без щомісячних платежів
Умови виникнення кредитної угоди
Аудит витрат на оплату праці. Мета і завдання аудиту
Основні поняття системи супутникового зв’язку
Оцінювання ефективності інвестицій


Категорія: Теорія статистики | Додав: koljan (24.09.2012)
Переглядів: 1492 | Рейтинг: 0.0/0
Всього коментарів: 0
Додавати коментарі можуть лише зареєстровані користувачі.
[ Реєстрація | Вхід ]

Онлайн замовлення

Заказать диплом курсовую реферат

Інші проекти




Діяльність здійснюється на основі свідоцтва про держреєстрацію ФОП