К структурным средним величинам в статистике относят моду, медиану и квартили, квинтили, децили, перцентили. Медиана – это значение признака, находящийся в середине ранжированной (упорядоченной по возрастанию или убыванию) совокупности. Медиана делит изучаемую совокупность на две равные части – у половины единиц совокупности значение признака меньше медианы, а у другой половины единиц совокупности значение признака больше медианы. Медиана является центром распределения. Основное свойство медианы заключается в том, что сумма абсолютных отклонений фактических значений от медианы меньше, чем от любой другой величины: , где - i-тый вариант признака, - значение медианы. Медиана может быть определена для количественных и порядковых признаков. Расчет медианы для альтернативных и атрибутивных признаков невозможен, так как эти признаки нельзя ранжировать. Порядок расчета медианы: 1. расположить данные в порядке возрастания (или убывания) значений признака; 2 определить номер медианной единицы , (3.13) где - номер медианной единицы, n –число единиц совокупности; 3. определить медиану, т.е. значение признака соответствующее номеру медианной единицы. Расчет медианы зависит от: - характера исходных данных, а именно, от четного или нечетного числа единиц совокупности; - от вида признака (количественный или порядковый); - формы представления исходных данных (не сгруппированные данные, дискретный ряд распределения, интервальный ряд распределения). Медиана количественного признака для интервального ряда распределения определяется по формуле: , (3.14) где - нижняя граница медианного интервала; i –величина интервала; - накопленная частота интервала, предшествующего медианному; - частота медианного интервала; - число единиц совокупности. Медианным является интервал, первая накопленная частота которого превышает половину объема совокупности. Мода – значение признака, наиболее часто встречающееся в совокупности. Расчет моды для несгруппированных данных состоит в определении наиболее часто встречающегося значения. Если два и более варианта признака встречаются чаще остальных, то будет соответственно несколько модальных значений. Расчет моды для дискретного ряда распределения состоит в определении признака имеющего наибольшую частоту. Моду для интервального ряда распределения определяют по формуле: , (3.15) где - нижняя граница модального интервала; i –величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. Модальным называется интервал с наибольшей частотой. Расчет моды для порядковых и атрибутивных признаков не представляет сложности с математической точки зрения и состоит в определении значения признака, которое встречается чаще остальных. Средняя, медиана и мода характеризуют типичное значение признака в изучаемой совокупности. Вместе с тем каждый из перечисленных показателей имеет свою экономическую интерпретацию и особенности применения. Использование перечисленных показателей зависит от вида признака и характера распределения. В анализе распределений порядковых признаков используют медиану и моду. Порядковые данные не имеют среднего значения. Типичное значение порядкового признака может быть выражено с помощью медианы и моды. При этом медиана отражает значение признака наиболее близкого ко всем единицам совокупности, а мода, характеризует наиболее распространение значение признака. В анализе распределений количественных признаков для однородной совокупности обычно рассчитывают все три показателя. При этом соотношение значений средней, медианы и моды позволяют судить о характере распределения. Если данные Рис. 3.1.Симметричное распределение распределены симметрично, то значения средней медианы и моды совпадают (рис. 3.1.) Если распределение характеризуется ассиметрией, то значения средней и медианы отличаются. В распределениях с левосторонней ассиметрией значение средней меньше значений медианы и моды. В распределениях с правосторонней ассиметрией значение средней больше значений медианы и моды (рис. 3.2)
Рис. 3.2. Правосторонняя ассиметрия
Аномальные значения (значения существенно отличающиеся от других) не влияют на расчет медианы, но могут оказать существенное влияние на среднее значение признака. Поэтому, медиана является наиболее предпочтительной, по сравнению со средней величиной, характеристикой типичного уровня признака неоднородных совокупностей. Квартили – это значения признака в упорядоченной совокупности, которые делят совокупность на четыре равные части. Первая или нижняя квартиль ( ) характеризует значение признака, меньше которого расположено 25% единиц совокупности, а больше – 75%. Вторая квартиль соответствует медиане ( ), т.е. у 50% единиц совокупности значение признака меньше второй квартили, а у 50% - больше. Третья или верхняя квартиль ( ) характеризует значение признака, меньше которого расположено 75% единиц совокупности, а больше – 25%. Квинтили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на пять равных частей. Первая или нижняя квинтиль ( ) характеризует значение признака, меньше которого расположено 20% единиц совокупности, а больше – 80%. Четвертая или верхняя квинтиль ( ) характеризует значение признака, меньше которого расположено 80% единиц совокупности, а больше – 20%. Децили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на десять равных частей. Первая или нижняя дециль ( ) характеризует значение признака, меньше которого расположено 10% единиц совокупности, а больше – 90%. Девятая или верхняя дециль ( ) характеризует значение признака, меньше которого расположено 90% единиц совокупности, а больше – 10%. Перцентили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на сто равных частей.
Ви переглядаєте статтю (реферат): «Структурные средние» з дисципліни «Бізнес-статистика та прогнозування»